Re-ViLM: Retrieval-Augmented Visual Language Model for Zero and Few-Shot
Image Captioning [154.0] 本稿では,Flamingo上に構築されたRetrieval-augmented Visual Language Model,Re-ViLMを紹介する。
外部データベースに特定の知識を明示的に格納することで、モデルパラメータの数を減らすことができる。
Re-ViLMは画像・テキスト生成タスクの性能を大幅に向上させることを示した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 04:18:00 GMT)
Active Retrieval Augmented Generation [123.7] 外部知識資源から情報を取得することで、大きな言語モデル(LM)を拡張することは、有望な解決策である。
ほとんどの既存の検索拡張LMは、入力に基づいて一度だけ情報を検索する検索と生成のセットアップを採用している。
本稿では,将来的な内容を予測するために,文の予測を反復的に利用する汎用手法であるフォワード・フォワード・アクティブ・レトリヴァル・ジェネレーション・ジェネレーション(FLARE)を提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 00:11:13 GMT)
Not All Languages Are Created Equal in LLMs: Improving Multilingual
Capability by Cross-Lingual-Thought Prompting [123.2] 大規模言語モデル(LLM)は印象的な多言語機能を示すが、その性能は言語によって大きく異なる。
XLT (cross-lingual- Thought prompting) という,シンプルで効果的な方法を提案する。
XLTは汎用テンプレートプロンプトで、言語間および論理的推論スキルを刺激し、言語間のタスクパフォーマンスを向上させる。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 13:43:27 GMT)
Neural Eigenfunctions Are Structured Representation Learners [93.5] 本稿ではニューラル固有写像という,構造化された適応長の深部表現を提案する。
本稿では,データ拡張設定における正の関係から固有関数が導出される場合,NeuralEFを適用することで目的関数が得られることを示す。
画像検索システムにおいて,適応長符号のような表現を用いることを実証する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 14:49:15 GMT)
Re$^3$Dial: Retrieve, Reorganize and Rescale Dialogue Corpus for
Long-Turn Open-Domain Dialogue Pre-training [90.3] 既存の事前学習コーパスのほとんどの対話は、3回未満の対話を含む。
数十億ドル規模のロングターン対話を自動的に構築するRetrieve, Reorganize, Rescale framework (Re$3$Dial)を提案する。
上記のプロセスを繰り返すことで、Re$3$Dialはコヒーレントなロングターン対話をもたらすことができる。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 07:41:06 GMT)
One-for-All: Towards Universal Domain Translation with a Single StyleGAN [86.3] 視覚的に異なる領域間の表現を変換するための新しい翻訳モデルUniTranslatorを提案する。
提案したUniTranslatorは汎用的で、スタイルミキシング、スタイリゼーション、翻訳など様々なタスクを実行できる。
UniTranslatorは、既存の汎用モデルの性能を超越し、代表タスクの特殊モデルに対してよく機能する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 08:02:55 GMT)
Revisiting Automated Topic Model Evaluation with Large Language Models [82.9] より大きな言語モデルは、結果のトピックを適切に評価する。
次に,大規模言語モデルを用いてトピックの最適な数を自動的に決定できるかどうかを検討する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 09:46:13 GMT)
HIQL: Offline Goal-Conditioned RL with Latent States as Actions [81.7] オフラインデータからゴール条件付きRLの階層的アルゴリズムを提案する。
この階層的な分解によって、推定値関数のノイズに頑健になることを示す。
提案手法は,従来の手法を巧みに操り,高次元画像観察にスケールできるとともに,アクションフリーなデータを容易に利用することができる。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 03:56:48 GMT)
Patch-level Neighborhood Interpolation: A General and Effective
Graph-based Regularization Strategy [77.3] 我々は、ネットワークの計算において非局所的な表現を行うtextbfPatch-level Neighborhood Interpolation(Pani)と呼ばれる一般的な正規化器を提案する。
提案手法は,異なる層にパッチレベルグラフを明示的に構築し,その近傍のパッチ特徴を線形に補間し,汎用的で効果的な正規化戦略として機能する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 23:32:42 GMT)
Rethinking Model Selection and Decoding for Keyphrase Generation with
Pre-trained Sequence-to-Sequence Models [76.5] キーフレーズ生成(英: Keyphrase Generation, KPG)は、NLPにおける長年の課題である。
Seq2seq 事前訓練言語モデル (PLM) は KPG に転換期を迎え、有望な性能改善をもたらした。
本稿では, PLM に基づく KPG におけるモデル選択と復号化戦略の影響について, 系統解析を行った。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 08:37:43 GMT)
Self-Evolution Learning for Mixup: Enhance Data Augmentation on Few-Shot
Text Classification Tasks [75.4] テキスト分類におけるデータ拡張のための自己進化学習(SE)に基づくミックスアップ手法を提案する。
モデル出力と原サンプルの1つのホットラベルを線形に補間して,新しい軟質なラベル混在を生成する,新しいインスタンス固有ラベル平滑化手法を提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 16:38:51 GMT)
An In-Context Schema Understanding Method for Knowledge Base Question
Answering [74.4] 知識ベース質問回答(KBQA)タスクは、与えられた知識ベースに基づいて自然言語質問に回答することを目的としている。
このタスクの一般的な方法として、セマンティックパーシングベースのものは、まず自然言語の質問を論理形式(SPARQLクエリなど)に変換し、その後、知識ベースでそれらを実行して答えを得る。
近年,Large Language Models (LLMs) は言語理解に強い能力を示し,そのような手法のセマンティクスとして採用されている。
本稿では,LLMを意味として用いるためのインコンテキスト理解(ICSU)手法を提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 04:19:17 GMT)
Merging Generated and Retrieved Knowledge for Open-Domain QA [72.4] COMBOは、より良いオープンドメインQAフレームワークのための互換性指向の知識の融合である。
COMBOは4つのテスト済みオープンドメインQAベンチマークのうち3つで競合ベースラインを上回っていることを示す。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 19:37:06 GMT)
GIMLET: A Unified Graph-Text Model for Instruction-Based Molecule
Zero-Shot Learning [71.9] 本研究は,ゼロショット環境下での分子関連タスクの実現に自然言語命令を用いることの実現可能性について検討する。
既存の分子テキストモデルは、命令の不十分な処理とグラフの限られた容量のために、この設定では性能が良くない。
グラフデータとテキストデータの両方の言語モデルを統合するGIMLETを提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 18:13:40 GMT)
A Quadratic Synchronization Rule for Distributed Deep Learning [71.5] 本研究は、擬似同期規則(QSR)と呼ばれる$H$を決定するための理論基底法を提案する。
ResNet と ViT の実験により、QSR を用いた局所勾配法は、他の同期戦略よりもテスト精度を一貫して向上することが示された。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 21:38:57 GMT)
Merging Experts into One: Improving Computational Efficiency of Mixture
of Experts [71.4] スパースミキチャー・オブ・エキスパート(MoE)は、パラメータの小さなサブセットをアクティベートすることでコストを削減することができる。
計算コストを大幅に高めることなく、より多くの専門家を追加するという利点を維持できるだろうか?
そこで我々は,textbftexttMerging Experts into One (MEO) という計算効率のよい手法を提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 19:39:58 GMT)
Prompt-based Grouping Transformer for Nucleus Detection and
Classification [70.6] 核の検出と分類は、疾患の診断に有効な情報を生み出す。
既存のほとんどの手法は、核を独立に分類するか、核とそのグループの特徴の間の意味的類似性を十分に利用しない。
グループ変換器をベースとした新しいエンドツーエンドの原子核検出・分類フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 04:50:48 GMT)
Diffusion-based Data Augmentation for Nuclei Image Segmentation [68.3] 核セグメンテーションのための拡散法を初めて導入する。
このアイデアは、多数のラベル付き画像を合成し、セグメンテーションモデルを訓練することを目的としている。
実験の結果,10%のラベル付き実データセットを合成サンプルで拡張することにより,同等のセグメンテーション結果が得られることがわかった。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 06:16:16 GMT)
Multi-stream Cell Segmentation with Low-level Cues for Multi-modality
Images [66.8] 我々は,顕微鏡画像のラベル付けを行うセル分類パイプラインを開発した。
次に、分類ラベルに基づいて分類モデルを訓練する。
2種類のセグメンテーションモデルを、丸みを帯びた形状と不規則な形状のセグメンテーションセルに展開する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 08:11:08 GMT)
Social Commonsense-Guided Search Query Generation for Open-Domain
Knowledge-Powered Conversations [66.2] 本稿では,ソーシャルコモンセンスによってガイドされたインターネット検索クエリ生成に焦点を当てた新しいアプローチを提案する。
提案フレームワークは,トピックトラッキング,コモンセンス応答生成,命令駆動クエリ生成を統合することで,受動的ユーザインタラクションに対処する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 16:14:56 GMT)
Learning Generalizable Manipulation Policies with Object-Centric 3D
Representations [65.6] GROOTは、オブジェクト中心と3D事前の堅牢なポリシーを学ぶための模倣学習手法である。
ビジョンベースの操作のための初期訓練条件を超えて一般化するポリシーを構築する。
GROOTのパフォーマンスは、バックグラウンドの変更、カメラの視点シフト、新しいオブジェクトインスタンスの存在に関する一般化に優れています。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 18:51:45 GMT)
TransY-Net:Learning Fully Transformer Networks for Change Detection of
Remote Sensing Images [64.6] リモートセンシング画像CDのためのトランスフォーマーベース学習フレームワークTransY-Netを提案する。
グローバルな視点からの特徴抽出を改善し、ピラミッド方式で多段階の視覚的特徴を組み合わせる。
提案手法は,4つの光学式および2つのSAR画像CDベンチマーク上での最先端性能を実現する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 07:42:19 GMT)
AdaLomo: Low-memory Optimization with Adaptive Learning Rate [64.0] 大規模言語モデルに対する適応学習率(AdaLomo)を用いた低メモリ最適化を提案する。
AdaLomoはAdamWと同等の結果を得ると同時に、メモリ要件を大幅に削減し、大きな言語モデルをトレーニングするためのハードウェア障壁を低くする。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 13:37:33 GMT)
Retrieving Texts based on Abstract Descriptions [63.9] 埋め込みベクトル上の類似性検索は、クエリによる検索を可能にするが、埋め込みに反映される類似性は不定義であり、一貫性がない。
我々は,その内容の抽象的記述に基づいて文を検索する,明確に定義された一貫したタスクを同定する。
そこで本研究では,近隣の標準探索で使用する場合の精度を大幅に向上する代替モデルを提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 17:38:42 GMT)
WiCE: Real-World Entailment for Claims in Wikipedia [63.2] We propose WiCE, a new fine-fine textual entailment dataset built on natural claim and evidence pairs from Wikipedia。
標準クレームレベルのエンターメントに加えて、WiCEはクレームのサブ文単位に対するエンターメント判断を提供する。
我々のデータセットの真のクレームは、既存のモデルで対処できない検証と検索の問題に挑戦することを含んでいる。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 18:11:08 GMT)
Promoting Generalization for Exact Solvers via Adversarial Instance
Augmentation [62.7] Adarは、模倣学習ベース(ILベース)と強化学習ベース(RLベース)の両方の一般化を理解し、改善するためのフレームワークである。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 03:15:36 GMT)
Disentanglement via Latent Quantization [60.4] 本研究では,組織化された潜在空間からの符号化と復号化に向けた帰納的バイアスを構築する。
本稿では,基本データレコーダ (vanilla autoencoder) と潜時再構成 (InfoGAN) 生成モデルの両方に追加することで,このアプローチの広範な適用性を実証する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 09:44:24 GMT)
OmniQuant: Omnidirectionally Calibrated Quantization for Large Language
Models [59.2] 大規模言語モデル(LLM)は自然言語処理タスクに革命をもたらした。
最近のPTQ法はメモリフットプリントの削減に有効であるが、極端に低ビットの量子化に対処できない。
多様な量子化設定において優れた性能を実現するLLMのOmnidirectly calibrated Quantization手法を提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 08:10:10 GMT)
Bi-Drop: Enhancing Fine-tuning Generalization via Synchronous sub-net
Estimation and Optimization [58.9] Bi-Dropは、様々なサブネットからの勾配を使ってモデルパラメータを選択的に更新する微調整戦略である。
GLUEベンチマークの実験は、Bi-Dropが従来の微調整方法よりも一貫して優れていることを示した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 11:46:33 GMT)
From Chaos to Clarity: Claim Normalization to Empower Fact-Checking [57.0] Claim Normalization(または ClaimNorm)は、複雑で騒がしいソーシャルメディア投稿を、より単純で理解しやすい形式に分解することを目的としている。
我々は,人間の推論過程を模倣し,チェーン・オブ・シントとクレーム・チェック・バシネス推定を活用する先駆的アプローチであるCACNを提案し,複雑なクレームを理解する。
我々は、ソーシャルメディア投稿の6万件以上のインスタンスと、それぞれの正規化されたクレームを含む、包括的な実世界のデータセットであるCLANを慎重にコンパイルする。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 16:07:06 GMT)
COFFEE: Counterfactual Fairness for Personalized Text Generation in
Explainable Recommendation [56.5] ユーザ記述テキストに固有のバイアスは、言語品質の異なるレベルとユーザの保護された属性を関連付けることができる。
説明生成における測度特異的な対実的公正性を実現するための一般的な枠組みを提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 23:12:51 GMT)
PHD: Pixel-Based Language Modeling of Historical Documents [55.8] 実史文書に類似した合成スキャンを生成する新しい手法を提案する。
我々は,1700-1900年代における合成スキャンと実際の歴史新聞を組み合わせて,我々のモデルであるPHDを事前訓練した。
我々は、この領域におけるその有用性を強調しながら、我々のモデルを歴史的QAタスクに適用することに成功しました。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 08:45:48 GMT)
Text generation for dataset augmentation in security classification
tasks [55.7] 本研究では、複数のセキュリティ関連テキスト分類タスクにおいて、このデータギャップを埋めるための自然言語テキストジェネレータの適用性を評価する。
我々は,GPT-3データ拡張戦略において,既知の正のクラスサンプルに厳しい制約がある状況において,大きなメリットを見出した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 22:25:14 GMT)
Multi-task Paired Masking with Alignment Modeling for Medical
Vision-Language Pre-training [55.6] 本稿では,マルチタスク・ペアド・マスキング・アライメント(MPMA)に基づく統合フレームワークを提案する。
また, メモリ拡張クロスモーダルフュージョン (MA-CMF) モジュールを導入し, 視覚情報を完全統合し, レポート再構築を支援する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 13:06:45 GMT)
A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.2] 異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 03:09:54 GMT)
Democratizing LLMs: An Exploration of Cost-Performance Trade-offs in
Self-Refined Open-Source Models [53.9] SoTAは7Bから65Bまでのさまざまなサイズのオープンソースモデルを平均して、ベースラインのパフォーマンスから8.2%改善している。
厳密に言えば、Vicuna-7Bのような非常に小さなメモリフットプリントを持つモデルでさえ、全体的な11.74%の改善と、高い創造性、オープンエンドタスクの25.39%の改善を示している。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 00:37:06 GMT)
SpawnNet: Learning Generalizable Visuomotor Skills from Pre-trained
Networks [52.8] 本稿では,事前学習した視覚表現のカテゴリレベルでの一般化能力について検討する。
本研究では,事前学習した多層表現を独立したネットワークに融合させて,ロバストなポリシーを学習する,新しい2ストリームアーキテクチャSpawnNetを提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 03:16:41 GMT)
Learning Invariant Molecular Representation in Latent Discrete Space [52.1] 本稿では,分散シフトに対する不変性とロバスト性を示す分子表現を学習するための新しい枠組みを提案する。
我々のモデルは、様々な分布シフトが存在する場合に、最先端のベースラインに対してより強力な一般化を実現する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 04:06:44 GMT)
NERetrieve: Dataset for Next Generation Named Entity Recognition and
Retrieval [49.8] 我々は、大きな言語モデルによって提供される能力は、NER研究の終わりではなく、むしろエキサイティングな始まりであると主張する。
我々は、NERタスクの3つの変種と、それらをサポートするデータセットを示す。
500のエンティティタイプをカバーする400万段落の,大規模で銀の注釈付きコーパスを提供する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 12:23:00 GMT)
Quantum Conformal Prediction for Reliable Uncertainty Quantification in
Quantum Machine Learning [48.0] 量子モデルは暗黙の確率予測器を実装し、測定ショットを通じて各入力に対して複数のランダムな決定を生成する。
本稿では、そのようなランダム性を利用して、モデルの不確実性を確実に捉えることができる分類と回帰の両方の予測セットを定義することを提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 19:51:31 GMT)
Evaluating Subjective Cognitive Appraisals of Emotions from Large
Language Models [47.9] この研究は、24の評価次元を評価する最も包括的なデータセットであるCovidET-Appraisalsを提示することでギャップを埋める。
CovidET-Appraisalsは、認知的評価を自動的に評価し、説明するための大規模言語モデルの能力を評価するのに理想的なテストベッドを提供する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 19:12:17 GMT)
Can Language Models Laugh at YouTube Short-form Videos? [45.5] ユーザ生成したYouTubeから10Kのマルチモーダルな面白いビデオのデータセット、ExFunTubeをキュレートします。
GPT-3.5を用いたビデオフィルタリングパイプラインを用いて,ユーモアに寄与する言語的要素と視覚的要素の両方を検証する。
フィルタリング後、各ビデオにタイムスタンプとテキスト説明をアノテートします。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 03:01:38 GMT)
Orthogonal Subspace Learning for Language Model Continual Learning [45.4] O-LoRAは、言語モデルにおける継続学習のためのシンプルで効率的なアプローチである。
提案手法は,パラメータの余分な追加コストのみを誘導し,再生にユーザデータストレージを必要としない。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 02:23:44 GMT)
Using In-Context Learning to Improve Dialogue Safety [45.3] チャットボットからの応答のバイアスや毒性を低減するための検索手法について検討する。
コンテキスト内学習を使用して、モデルをより安全な世代に向けて操る。
本手法は,トレーニングを必要とせず,強いベースラインと競合する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 19:28:24 GMT)
Qualifying Chinese Medical Licensing Examination with Knowledge Enhanced
Generative Pre-training Model [44.0] 中国国立医学ライセンス試験(CNMLE)におけるChatGPTの評価
単純だが効果的な検索手法を用いて、医学的背景知識を意味的指示として抽出する。
関連する医学的質問は、ChatGPTのデモンストレーションとして特定され、提供されます。
知識向上モデルでは, CNMLE-2022では, 資格を合格するだけでなく, 人間の平均スコア(61。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 17:03:23 GMT)
GPT-RE: In-context Learning for Relation Extraction using Large Language
Models [44.0] GPT-REは、関係抽出における大きな言語モデルと完全な教師付きベースラインのギャップを埋める。
広く使われている4つのREデータセット上でGPT-REを評価し、GPT-REが既存のGPT-3ベースラインよりも改善されていることを観察した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 09:13:25 GMT)
Learning the Visualness of Text Using Large Vision-Language Models [42.8] 視覚的テキストは人の心の中のイメージを誘発するが、視覚的でないテキストはそれを起こさない。
テキスト内の視覚を自動的に検出する手法により、テキスト・ツー・イメージ検索と生成モデルにより、関連する画像でテキストを拡張できる。
我々は,3,620の英語文のデータセットと,複数のアノテータによって提供されるその視覚性スコアをキュレートする。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 19:06:01 GMT)
Monte Carlo Thought Search: Large Language Model Querying for Complex
Scientific Reasoning in Catalyst Design [42.4] 大規模言語モデル(LLM)は、複雑な命令に従う能力と高品質な推論を通じて化学の新たな能力を実証している。
本稿では,モンテカルロ木探索に基づく手法を提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 21:29:33 GMT)
From Static to Dynamic: A Continual Learning Framework for Large
Language Models [41.6] 本稿では,大規模言語モデル(LLM)のための新しい連続学習フレームワークであるDynaMindについて述べる。
DynaMindはメモリ機構を導入し、新しい知識とモジュラー演算子を同化してモデル推論プロセスを強化する。
ベンチマーク実験は、これらの課題を克服するDynaMindの有効性を実証している。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 10:18:53 GMT)
Once is Enough: A Light-Weight Cross-Attention for Fast Sentence Pair
Modeling [40.9] トランスフォーマーベースのモデルは文ペアモデリングタスクで大きな成功を収めた。
最近の研究は、より高速な計算のためのデュアルエンコーダと遅延相互作用アーキテクチャを提案する。
本稿では,効率的な文ペアモデリングのための新しいパラダイムMixEncoderを提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 10:38:48 GMT)
Preference Elicitation with Soft Attributes in Interactive
Recommendation [39.7] 本研究では,ソフト属性を適応し,アイテムと属性に基づく嗜好を引き出す新しい選好選好方法を提案する。
提案手法は,商品とソフト属性の両方を用いてユーザに対してクエリを行い,レコメンデーション品質を改善するために,レコメンデーションシステムの好みに対する信念を更新する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 17:23:20 GMT)
Manifold-Preserving Transformers are Effective for Short-Long Range
Encoding [39.1] マルチヘッドセルフアテンションベースのトランスフォーマーは、異なる学習タスクにおいて有望であることを示す。
本研究では,一対のトークン間の層間距離保存を理論的に保証するエンコーダモデルTransJectを提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 06:58:28 GMT)
When Urban Region Profiling Meets Large Language Models [38.9] 本稿では,テキストモダリティの知識を都市画像のプロファイリングに取り入れた最初のフレームワークを紹介する。
オープンソースのImage-to-Text LLMにより,衛星画像毎の詳細なテキスト記述を生成する。
モデルは画像とテキストのペアに基づいて訓練され、都市視覚表現学習のための自然言語の監督をシームレスに統一する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 02:32:53 GMT)
Rethinking the Open-Loop Evaluation of End-to-End Autonomous Driving in
nuScenes [38.4] 計画課題は、内部意図と外部環境の両方からの入力に基づいて、エゴ車両の軌道を予測することである。
既存の研究の多くは、予測された軌道と地上の真実との衝突率とL2誤差を用いて、nuScenesデータセット上での性能を評価する。
本稿では,これらの既存の評価指標を再評価し,異なる手法の優越性を正確に測定するかどうかを検討する。
我々の単純な手法は、nuScenesデータセットと他の知覚に基づく手法と同じようなエンド・ツー・エンドの計画性能を実現し、平均L2誤差を約20%削減する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 02:45:33 GMT)
A Survey on Semantic Processing Techniques [38.3] 意味論の研究は言語学において多次元である。
計算意味処理の研究の深さと幅は、新しい技術で大きく改善できる。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 15:09:51 GMT)
A Predictive Factor Analysis of Social Biases and Task-Performance in
Pretrained Masked Language Models [37.6] 社会的バイアスは、事前訓練された言語マスケッド言語モデル(MLM)によって報告されている。
我々は、異なるモデルサイズ、訓練対象、トークン化方法、データドメインと言語をカバーする39以上の事前訓練研究を行う。
我々の結果は、トークン化やモデル目的など、以前の文献で無視される重要な要素に光を当てた。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 14:19:01 GMT)
DANAA: Towards transferable attacks with double adversarial neuron
attribution [37.3] そこで我々は,DANAAと呼ばれる二重対向ニューロン帰属攻撃法を提案し,より正確な特徴重要度推定を行う。
目標は、個々のニューロンの重みを計測し、転送可能性にとってより重要な特徴を保持することである。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 16:06:00 GMT)
Towards Being Parameter-Efficient: A Stratified Sparsely Activated
Transformer with Dynamic Capacity [37.0] Stratified Mixture of Experts (SMoE)モデルは、異なるトークンに動的キャパシティを割り当てることができる。
SMoEは、同じまたは少ないパラメータで複数の最先端MoEモデルより優れていることを示す。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 21:09:23 GMT)
Universal representation by Boltzmann machines with Regularised Axons [34.3] 正規化されたボルツマンマシンは任意の分布を表現できることを示す。
また、正規化されたボルツマンマシンは、任意の相関した多くの可視パターンを完全検索で指数関数的に保存できることを示す。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 20:05:47 GMT)
TimbreTron: A WaveNet(CycleGAN(CQT(Audio))) Pipeline for Musical Timbre
Transfer [34.0] 音声信号の時間周波数表現に「画像」ドメインスタイルの転送を適用した音色伝達手法であるTimbreTronを紹介する。
定Q変換表現は、畳み込みアーキテクチャに特に適していることを示す。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 04:43:08 GMT)
MIRACLE: Towards Personalized Dialogue Generation with Latent-Space
Multiple Personal Attribute Control [33.9] ttributes textbfControl in textbfLatent-Space textbfEnergy-based Models。
我々は条件付き変分自動エンコーダを用いて、潜伏する関節属性空間内の密集したパーソナライズされた応答と整合する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 08:44:26 GMT)
Neural Multi-Objective Combinatorial Optimization with Diversity
Enhancement [33.3] 本稿では,多目的最適化(MOCO)問題に対するダイバーシティ強化(NHDE)を新たに提案する。
NHDEは、多様性の高いParetoフロントを生成することができ、それによって全体的なパフォーマンスを向上できることを示す。
我々のNHDEは汎用的であり、MOCOの異なるニューラルメソッドに適用できる。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 08:50:57 GMT)
Model Sparsity Can Simplify Machine Unlearning [33.2] 最近のデータ規制要件に応えて、マシン・アンラーニング(MU)が重要なプロセスとして登場した。
本研究は,ウェイトプルーニングによるモデルスペーシフィケーションという,新しいモデルベース視点を紹介する。
理論と実践の両方において、モデルスパーシティは、近似アンラーナーのマルチ基準アンラーニング性能を高めることができることを示す。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 16:23:51 GMT)
OV-VG: A Benchmark for Open-Vocabulary Visual Grounding [33.0] この研究は、新規で挑戦的なオープンボキャブラリ視覚タスクを導入している。
包括的な目的は、言語記述と新しいオブジェクトのローカライゼーションの関連を確立することである。
我々は、7,272 OV-VG画像と1,000 OV-PL画像を含むベンチマークをキュレートした。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 17:54:53 GMT)
Robust Visual Imitation Learning with Inverse Dynamics Representations [32.8] 我々は,専門家環境と学習環境を整合させるために,逆ダイナミクス状態表現学習目標を開発する。
抽象状態表現を用いて、行動データと専門家データとの類似性を徹底的に測定する効果的な報酬関数を設計する。
提案手法は,ほとんどの環境においてほぼ熟練した性能を実現し,最先端のビジュアルIL法やロバストIL法を著しく上回っている。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 11:47:35 GMT)
Reconstruct Before Summarize: An Efficient Two-Step Framework for
Condensing and Summarizing Meeting Transcripts [32.3] 本稿では,効率的なミーティング要約のための2段階のフレームワークであるReconstruct before Summarize (RbS)を提案する。
RbSは、まず自己管理パラダイムを利用して、ミーティングの書き起こしを再構築することで、本質的な内容に注釈を付ける。
次に,相対的な位置バケット化(RPB)アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 17:42:44 GMT)
Language Model Unalignment: Parametric Red-Teaming to Expose Hidden
Harms and Biases [32.2] Red-teamingは、モデルの安全行動をジェイルブレイクして、クエリの有害性を無視した有用なエージェントとして機能させることを目的としている。
我々は、安全研究、すなわち、Unalignmentを通してのレッドチームについて、新しい視点を提示する。
統一性はモデルパラメータを調整し、モデルの振舞いに深く根付いていないモデルガードレールを壊す。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 13:55:46 GMT)
Shortcuts for causal discovery of nonlinear models by score matching [32.0] 非線形付加雑音モデルのスコア・ソータビリティ・パターンを定義し,特徴付ける。
文献において最も一般的な合成ベンチマークのスコアソート性を示す。
本研究は, 非線形因果発見手法の評価において, データの多様性の欠如が重要な限界であることを示すものである。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 10:09:52 GMT)
Revisiting Deep Ensemble for Out-of-Distribution Detection: A Loss
Landscape Perspective [31.2] In-Distribution Data(InD)からOoDサンプルを検出するOoD検出手法
我々は,OoD検出における損失景観とモードアンサンブルの新しい視点を提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 08:11:51 GMT)
A General Theory for Softmax Gating Multinomial Logistic Mixture of
Experts [30.7] 本稿では,入力値をゲーティング関数に渡す前に変換する改良型ソフトマックスゲーティング関数を提案する。
その結果, 従来の相互作用は消失し, パラメータ推定率が大幅に向上した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 05:32:19 GMT)
You Are What You Annotate: Towards Better Models through Annotator
Representations [30.6] 我々はアノテータの様々な視点を直接モデル化しようと試みる。
埋め込みによって個々のアノテータの独特な傾向と主観性を捉えることで、私たちの表現は素AIモデルを多様な視点を包含するようにしている。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 17:10:54 GMT)
PPFL: A Personalized Federated Learning Framework for Heterogeneous
Population [30.5] 我々は、PPFLと呼ばれるフェデレートラーニングのパラダイムの中で、フレキシブルで解釈可能なパーソナライズされたフレームワークを開発する。
標準モデルを利用することで、不均一性をこれらのベクトルに対するクライアントの好みとしてモデル化し、メンバーシップの好みを利用する。
本研究は,病理学的特徴と実践的データセットの両方について実験を行い,PPFLの有効性を検証した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 16:06:27 GMT)
Partition Speeds Up Learning Implicit Neural Representations Based on
Exponential-Increase Hypothesis [30.3] Inlicit Neural representations (INR)は、画像を表現するために$textitcontinuous function$(ニューラルネットワーク)を学ぶことを目的としている。
画像は、色が完全に一致していない多くのオブジェクトから構成される傾向がある。
画像再構成のための2つのINR法の性能向上のための単純な分割機構を提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 05:15:58 GMT)
Text-to-Image Diffusion Models can be Easily Backdoored through
Multimodal Data Poisoning [29.9] 本稿では,多様なセマンティックレベルで画像合成を行う一般的なマルチモーダル・バックドア・アタック・フレームワークであるBadT2Iを提案する。
具体的には、Pixel-Backdoor、Object-Backdoor、Style-Backdoorの3つのレベルに対してバックドア攻撃を行います。
正規化損失を利用して,大規模なテキスト・画像拡散モデルにバックドアを効率よく注入する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 16:50:21 GMT)
Conversational Speech Recognition by Learning Audio-textual Cross-modal
Contextual Representation [29.6] 本稿では,クロスモーダルな会話表現を備えたコンフォーマーエンコーダデコーダモデルを拡張した,新しい会話型ASRシステムを提案する。
提案手法は、特殊エンコーダとモーダルレベルのマスク入力により、事前訓練された音声とテキストモデルを組み合わせる。
クロスモーダル表現と会話表現の両方をデコーダに導入することで、我々のモデルは情報損失のない長い文よりもコンテキストを保ちます。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 11:57:33 GMT)
Vision Language Models in Autonomous Driving and Intelligent
Transportation Systems [29.4] 本研究の目的は、自律運転(AD)とインテリジェントトランスポーテーションシステム(ITS)における視覚言語モデル(VLM)の現状と今後の動向を研究者に提供することである。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 21:06:10 GMT)
Cultural and Linguistic Diversity Improves Visual Representations [28.7] 異文化心理学と言語学は、個人が彼らの文化的背景と彼らが話す言語によって視覚的知覚が異なることを示した。
我々の研究は、多様な知覚様式が画像理解をいかに改善するかを示唆している。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 16:51:42 GMT)
TPTU: Large Language Model-based AI Agents for Task Planning and Tool
Usage [28.6] 大規模言語モデル(LLM)は、様々な現実世界のアプリケーションのための強力なツールとして登場した。
LLMの本質的な生成能力は、その長所にもかかわらず、複雑なタスクを扱うには不十分である。
本稿では,LLMベースのAIエージェントに適した構造化フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 10:53:54 GMT)
Probabilistic and Semantic Descriptions of Image Manifolds and Their
Applications [28.6] 画像は高次元空間の低次元多様体上にあると言うのが一般的である。
画像は多様体上に不均一に分布し、この分布を確率分布としてモデル化する方法を考案する。
多様体上の点を記述するために意味論的解釈がどのように用いられるかを示す。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 23:57:33 GMT)
ASC: Appearance and Structure Consistency for Unsupervised Domain
Adaptation in Fetal Brain MRI Segmentation [28.4] 高品質な胎児脳アトラスのセグメンテーションラベルを、未ラベルの胎児脳MRIデータに適応させる実用的非教師なし領域適応(UDA)セットを提案する。
周波数ベース画像変換の前後の一貫性を制約することにより、セグメント化モデルを異なる領域の外観に適応する。
FeTA 2021ベンチマークの実験は、登録ベース、半教師付き学習ベース、および既存のUDAベースの方法と比較して、ASCの有効性を実証している。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 04:12:06 GMT)
Ensemble Learning for Graph Neural Networks [28.4] グラフニューラルネットワーク(GNN)は、グラフ構造化データから学習するための様々な分野で成功している。
本稿では,GNNの性能とロバスト性向上のためのアンサンブル学習手法の適用について検討する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 03:55:13 GMT)
Visual-Attribute Prompt Learning for Progressive Mild Cognitive
Impairment Prediction [27.3] 本稿では,マルチモーダルな特徴を高速な微調整で抽出・融合するトランスフォーマーネットワークを提案する。
詳しくは、まずAD診断タスクのプロンプトなしでVAP-Formerを事前訓練し、pMCI検出タスクのモデルをPTで微調整する。
次に、視覚的プロンプトのための新しいグローバルプロンプトトークンを提案し、マルチモーダル表現に対するグローバルガイダンスを提供する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 02:49:53 GMT)
CLMSM: A Multi-Task Learning Framework for Pre-training on Procedural
Text [26.1] CLMSMはドメイン固有の継続的事前学習フレームワークであり、手続き的なレシピの集合から学習する。
CLMSMはレシピ(ドメイン内)のベースラインを上回るだけでなく、オープンドメインの手続き的NLPタスクにも一般化可能であることを示す。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 15:20:11 GMT)
Customising General Large Language Models for Specialised Emotion
Recognition Tasks [24.8] 言語感情認識において,大規模言語モデル (LLM) がどのように機能するかを検討する。
具体的には、公開され、広く使われているLLM -- Chat General Language Modelを例示します。
我々は2つの異なるモーダル適応手法、すなわちディープ・プロンプト・チューニングと低ランク適応を用いてターゲットにカスタマイズする。
実験結果から, 適応型LLMは, 他の最先端の深層モデルよりも容易に優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 08:09:13 GMT)
PromptCBLUE: A Chinese Prompt Tuning Benchmark for the Medical Domain [24.4] 我々は、中国生物医学言語理解評価(CBlue)ベンチマークを大規模なプロンプトチューニングベンチマークであるPromptCBlueに再構築した。
我々のベンチマークは、幅広いバイオメディカルタスクにおいて、中国のLCMのマルチタスク能力を評価するのに適したテストベッドであり、オンラインプラットフォームである。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 02:20:38 GMT)
CT-GAT: Cross-Task Generative Adversarial Attack based on
Transferability [24.3] 本稿では,様々なタスクにまたがる伝達可能な特徴を抽出して,直接対逆例を構築する手法を提案する。
具体的には,複数のタスクから収集した対数サンプルデータを用いて,CT-GATというシーケンス対シーケンス生成モデルを訓練し,普遍的対数特徴を得る。
その結果,本手法は低コストで優れた攻撃性能を達成できることが判明した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 11:00:04 GMT)
Be Selfish, But Wisely: Investigating the Impact of Agent Personality in
Mixed-Motive Human-Agent Interactions [24.3] セルフプレイのRLは交渉において妥協の価値を学ばないことがわかった。
我々は、多様な個性を持つエージェントを設計し、人間のパートナーとのパフォーマンスを分析するために、トレーニング手順を2つの新しい方法で修正する。
どちらの手法も有望性を示すが、自尊心のあるエージェントは、自己と交渉相手の両方に価値を生み出すことを暗黙的に学習することで、自身のパフォーマンスを最大化し、歩行を回避し、他の変種よりも優れた性能を発揮する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 20:31:35 GMT)
LLM-powered Data Augmentation for Enhanced Cross-lingual Performance [24.2] 本稿では,Large Language Models (LLMs) を利用したコモンセンス推論データセットにおけるデータ拡張の可能性について検討する。
これを実現するために、私たちは、XCOPA、XWinograd、XStoryClozeの3つのデータセットを増強するために、Dlly-v2、StableVicuna、ChatGPT、GPT-4といういくつかのLCMを利用する。
合成データを用いて,小型多言語モデルmBERTとXLMRの有効性を評価する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 22:57:00 GMT)
Hierarchical Vector Quantized Transformer for Multi-class Unsupervised
Anomaly Detection [24.1] 教師なし画像異常検出(UAD)は、正常サンプルの堅牢かつ識別的な表現を学習することを目的としている。
本稿では,複数のクラスに統一されたフレームワークを構築することに焦点を当てる。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 08:20:33 GMT)
SUT: Active Defects Probing for Transcompiler Models [24.0] 我々は、プログラミング言語翻訳のための新しいメトリクスを導入し、これらのメトリクスは基本的な構文エラーに対処する。
実験によると、ChatGPTのような強力なモデルでさえ、これらの基本的な単体テストで間違いを犯している。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 07:16:02 GMT)
MEGA: Multilingual Evaluation of Generative AI [23.1] 生成AIモデルは、多くの自然言語処理タスクで素晴らしいパフォーマンスを示している。
LLMのほとんどの研究は英語に限られている。
これらのモデルが、他の言語でのテキストの理解と生成にどの程度の能力があるかは定かではない。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 22:19:13 GMT)
Genetic Algorithms with Neural Cost Predictor for Solving Hierarchical
Vehicle Routing Problems [22.6] 車両の経路決定が高次決定と連動する場合、結果の最適化問題は計算に重大な課題をもたらす。
本稿では,ニューラルコスト予測器を用いた遺伝的アルゴリズム(GANCP)という,ディープラーニングに基づく新しいアプローチを提案する。
特に,提案するニューラルネットワークは,静電容量化車両ルーティング問題を解決するHGS-CVRPオープンソースパッケージの目的値について学習する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 02:46:37 GMT)
Multi-Agent Reinforcement Learning Guided by Signal Temporal Logic
Specifications [22.4] STL誘導型マルチエージェント強化学習フレームワークを提案する。
STL要求は、各エージェントの目的と安全仕様に応じてタスク仕様の両方を含むように設計され、STL仕様の値は、報酬を生成するために活用される。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 20:37:40 GMT)
Bridging Code Semantic and LLMs: Semantic Chain-of-Thought Prompting for
Code Generation [22.2] 本稿では,SeCoT というコードの意味情報を抽出する "Semantic Chain-of-Thought" 手法を提案する。
本研究では,SeCoTが最先端の性能を実現し,大規模モデルやコード生成の可能性を大幅に向上させることを示す。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 10:21:12 GMT)
High-Quality 3D Face Reconstruction with Affine Convolutional Networks [21.8] 3次元顔再構成では、入力画像(例えば顔)と標準/UV出力との間の空間的ずれが特徴符号化・復号処理を非常に困難にする。
我々は、空間的に非対応な入力および出力画像を扱うCNNベースのアプローチを可能にする新しいネットワークアーキテクチャ、すなわちAffine Convolution Networksを提案する。
提案手法はパラメトリックフリーであり,512×512ピクセルの解像度で高品質な紫外線マップを生成することができる。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 09:04:43 GMT)
A Comparative Study on Textual Saliency of Styles from Eye Tracking,
Annotations, and Language Models [21.2] 我々は、スタイリスティックテキストの人間の処理のための視線追跡データセットである eyeStyliency を提示する。
収集したアイデータセットを用いて,テキスト上でのサリエンシスコアを導出する様々な手法を開発した。
視線追跡データはユニークですが、人間のアノテーションとモデルに基づく重要度スコアの両方と交差しています。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 20:28:18 GMT)
Dancing Between Success and Failure: Edit-level Simplification
Evaluation using SALSA [21.1] 編集ベースのヒューマンアノテーションフレームワークであるSALSAを紹介する。
我々は、成功と失敗の全範囲をカバーする、言語的に基礎付けられた20の編集タイプを開発する。
LENS-SALSAは,文品質と単語品質を同時に予測するために訓練された,参照不要な自動単純化指標である。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 18:25:46 GMT)
From Dissonance to Insights: Dissecting Disagreements in Rationale
Construction for Case Outcome Classification [20.9] ケースアウトカム分類(COC)は正確で信頼できるものでなければならない。
ケーススタディは、法的NLPでベンチマークデータセットを作成する際の、過度な複雑さを明らかにしている。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 19:57:33 GMT)
Graph Convolutional Network with Connectivity Uncertainty for EEG-based
Emotion Recognition [20.7] 本研究では,脳波信号の空間依存性と時間スペクトルの相対性を表す分布に基づく不確実性手法を提案する。
グラフ混合手法は、遅延接続エッジを強化し、ノイズラベル問題を緩和するために用いられる。
感情認識タスクにおいて、SEEDとSEEDIVという2つの広く使われているデータセットに対するアプローチを評価した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 03:47:11 GMT)
Analysis of Dual-Based PID Controllers through Convolutional Mirror
Descent [20.5] 本稿では、オンラインアロケーション問題に対するデュアルベースPIDコントローラの性能に関する最初の後悔点について述べる。
デュアルベースPIDコントローラと,emphConvolutional Mirror Descent (CMD)と呼ばれるオンライン凸最適化のための新しい1次アルゴリズムの基本的な接続を確立する。
我々は非滑らかな凸最適化のためのCMDに対する最初の後悔の限界を提供するが、これは独立した関心事かもしれない。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 03:41:35 GMT)
ECG-CL: A Comprehensive Electrocardiogram Interpretation Method Based on
Continual Learning [20.5] 心電図(ECG)モニタリングは心血管疾患(CVD)早期診断の最も強力な手法の一つである。
古典的なルールベースのアルゴリズムは、今ではディープラーニングベースの手法によって完全にパフォーマンスが向上している。
本稿では,高解像度の低レベルセマンティック情報を一括して保持できるマルチレゾリューションモデルを提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 03:18:48 GMT)
LUNA: A Model-Based Universal Analysis Framework for Large Language
Models [20.0] 自己保持機構, 極めて大規模なモデルスケール, 自己回帰生成スキーマは, 品質解析における新たな課題を提示する。
汎用かつ解釈可能なLLMの普遍的解析フレームワークを提案する。
特に、私たちはまず、望ましい信頼性の観点からのデータを活用して抽象モデルを構築します。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 07:26:21 GMT)
Towards Foundation Models for Learning on Tabular Data [19.5] 我々は,現在のモデルの限界を克服するために,TabFM(Tabular Foundation Models)を提案する。
TabFMは、ベースモデルとして事前訓練された大言語モデル(LLM)を採用し、目的設計の目的を用いて微調整する。
ゼロショットやインコンテキスト推論のような命令追従タスクにおいてTabFMが優れていることを示す。
また,TabFMの限界や可能性についても検討し,より強力なTabFMの開発に向けた今後の研究を刺激し,促進することを目的とする。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 17:28:18 GMT)
Finite-Sample Analysis of the Temporal Difference Learning [19.4] 一般化された, インスタンスに依存しないステップサイズを持つ単純なアルゴリズムは, ほぼ最適分散とバイアス項を得るのに十分であることを示す。
本手法は, 線形近似のための洗練された誤差境界と, ランダム行列の積に対する新しい安定性結果に基づく。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 12:37:25 GMT)
PromptMix: A Class Boundary Augmentation Method for Large Language Model
Distillation [19.4] そこで本研究では,LLMの命令に従う能力を利用して,より有用な拡張データを生成する手法を提案する。
具体的PromptMix法は,1) クラス境界付近で挑戦的なテキスト拡張を生成するが,境界例の生成はデータセットにおける偽陽性のリスクを増加させる。
Banking77, TREC6, Subjectivity (SUBJ) と Twitter Complaints の4つのテキスト分類データセットに対して, 提案手法の有効性を検証した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 05:43:23 GMT)
Quantum Key Leasing for PKE and FHE with a Classical Lessor [19.1] 安全な鍵リースの問題は、取り消し可能暗号(revocable cryptography)としても知られる。
この問題は、量子情報の不可避な性質を活用することを目的としている。
我々は、(古典的な)公開鍵・同型暗号方式の復号鍵をリースするために、セキュアな鍵リース方式を構築した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 15:25:29 GMT)
Learning Support and Trivial Prototypes for Interpretable Image
Classification [19.0] Prototypeal part network (ProtoPNet) 法は解釈可能な分類を実現するために設計されている。
本稿では,特徴空間の分類境界付近にあるサポートプロトタイプを学習するための新しい手法により,ProtoPNetの分類を改善することを目的とする。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 14:20:27 GMT)
SuperUDF: Self-supervised UDF Estimation for Surface Reconstruction [18.7] SuperUDFは表面再構成のための自己教師型学習システムである。
効率的なトレーニングのために学習された幾何学と、スパースサンプリングのためのロバスト性のための新しい正規化を利用する。
品質と効率の両面で、いくつかの公開データセットで芸術の状態を上回ります。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 14:54:30 GMT)
Transformer-Based Language Model Surprisal Predicts Human Reading Times
Best with About Two Billion Training Tokens [17.8] 本研究では,トランスフォーマーをベースとした言語モデル変種から,人間の読解時間を予測する能力に基づいて推定した推定値について検討した。
その結果、現代のモデル能力を持つほとんどの変種からの推定は、約20億のトレーニングトークンを見た後、最も適していることがわかった。
新たに訓練されたより小さなモデル変種は収束時に「転換点」を示し、その後言語モデルの難易度が低下し始め、人間の読解時間に適合する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 20:03:54 GMT)
EDGE++: Improved Training and Sampling of EDGE [17.6] これらの問題に対処するために,EDGEモデルの強化を提案する。
具体的には,各時刻におけるアクティブノード数を最適化する等級別ノイズスケジュールを導入する。
また、生成過程を微調整し、合成されたネットワークと真のネットワークとの類似性をよりよく制御できる改良されたサンプリング手法を提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 22:54:20 GMT)
O3D: Offline Data-driven Discovery and Distillation for Sequential
Decision-Making with Large Language Models [16.9] 大規模言語モデル(LLM)の最近の進歩は、逐次的意思決定問題を解決する上で有望な性能を示した。
LLMエージェントのコンテキスト内学習性能を向上させるために,オフラインデータを大規模に活用するオフライン学習フレームワークを提案する。
次に、細調整なしでLCMによるポリシーを改善するために、オフラインデータ駆動型ディスカバリー・蒸留(O3D)フレームワークを導入する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 20:28:33 GMT)
Sources of Hallucination by Large Language Models on Inference Tasks [16.6] 大規模言語モデル (LLM) は自然言語推論 (NLI) が可能なと主張している。
本研究は, 制御実験を用いて行動調査を行う複数のLLMファミリーに関する一連の行動学的研究について述べる。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 21:22:29 GMT)
Distributed Variational Inference for Online Supervised Learning [15.0] 本稿では,スケーラブルな分散確率的推論アルゴリズムを提案する。
センサネットワークにおける連続変数、難解な後部データ、大規模リアルタイムデータに適用できる。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 23:59:07 GMT)
A Rigorous Link between Deep Ensembles and (Variational) Bayesian
Methods [14.8] ベイズ的,変分的ベイズ的,アンサンブル法の間の数学的に厳密な関係を確立した。
技術的なレベルでは、ワッサーシュタインフローのレンズを通して一般化された変分推論に寄与する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 14:44:18 GMT)
A global product of fine-scale urban building height based on spaceborne
lidar [14.7] 我々は2020年ごろに150mの細いグリッドサイズを基準に,都市ビルの高さの最新のグローバルな製品を提供する。
GEDIデータに基づく高さ推定法は, ピアソンrの0.78, RMSEの3.67mで有効であった。
この研究は、気候、環境、生態学、社会科学など多くの分野にわたる将来の都市研究を促進するだろう。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 16:51:15 GMT)
Clifford Group Equivariant Neural Networks [14.3] Clifford Group Equivariant Neural Networksは$mathrmO(n)$-および$mathrmE(n)$-equivariantモデルを構築するための新しいアプローチである。
私たちは、特に単一のコア実装から、いくつかの異なるタスクにおける最先端のパフォーマンスを示します。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 16:54:33 GMT)
Hexa: Self-Improving for Knowledge-Grounded Dialogue System [14.0] 本研究では,中間段階の生成性能を改善するための自己改善手法を開発した。
特に、適切な自己生成応答の多様性を高めるために、誘導プロンプトと改良された損失関数を備えた新しいブートストラップ方式を提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 23:58:53 GMT)
DiFair: A Benchmark for Disentangled Assessment of Gender Knowledge and
Bias [13.9] 事前訓練された言語モデルでよく見られる性別バイアスを軽減するために、デバイアス技術が提案されている。
これらはしばしば、予測においてモデルが性中立である範囲をチェックするデータセットで評価される。
この評価プロトコルは、バイアス緩和が有意義なジェンダー知識に悪影響を及ぼす可能性を見落としている。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 15:27:16 GMT)
A Retrieve-and-Read Framework for Knowledge Graph Link Prediction [13.9] 知識グラフ(KG)リンク予測は、KGの既存の事実に基づいて新しい事実を推測することを目的としている。
近年の研究では、グラフニューラルネットワーク(GNN)によるノードのグラフ近傍の利用は、単にクエリ情報を使用するよりも有用な情報を提供することが示された。
本稿では,まずクエリの関連部分グラフコンテキストを検索し,そのコンテキストとクエリを高容量の読者と共同で処理する新しい検索・読解フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 17:57:24 GMT)
LMC: Large Model Collaboration with Cross-assessment for Training-Free
Open-Set Object Recognition [13.7] 本研究では,異なる既成の大規模モデルを学習自由な方法で協調させることにより,その課題に対処する,Large Model Collaboration (LMC) という新しいフレームワークを提案する。
また,提案フレームワークをいくつかの新しい設計に組み込んで,大規模モデルから暗黙的な知識を効果的に抽出する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 07:57:56 GMT)
Improved Techniques for Training Consistency Models [13.5] 本稿では, 蒸留なしでデータから直接一貫性モデルを学習する, 整合性トレーニングのための改良手法を提案する。
整合性学習目的のための対数正規雑音スケジュールを提案し、トレーニングの繰り返し回数毎に全離散化ステップを2倍にすることを提案する。
これらの修正により、一貫性モデルは1回のサンプリングステップでCIFAR-10で2.51と3.25のFIDスコア、ImageNetで64ドルをそれぞれ達成できる。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 05:33:38 GMT)
A comprehensive survey on deep active learning and its applications in
medical image analysis [13.3] 深層学習は医用画像解析において広く成功し、大規模な専門家による医用画像データセットの需要が高まっている。
しかし、医用画像に注釈をつける高コストは、この分野での深層学習の発展を著しく妨げている。
アノテーションのコストを削減するため、アクティブラーニングは、アノテーションの最も有益なサンプルを選択し、できるだけ少ないラベル付きサンプルで高性能モデルを訓練することを目的としている。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 08:46:40 GMT)
Mobile AR Depth Estimation: Challenges & Prospects -- Extended Version [12.9] モバイルARにおける正確な距離深度推定を実現するための課題と機会について検討する。
新たに導入されたデータセット(ARKitScenes)上で,最先端のモノクル深度推定モデル4種を試験した。
私たちの研究は、これらの課題を探求し解決するための将来的な方向性を提供します。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 22:47:51 GMT)
Prefix-Tree Decoding for Predicting Mass Spectra from Molecules [12.9] 我々は、質量スペクトルを分子公式の集合として扱うことにより、分子からの質量スペクトルを予測するための新しい中間戦略を用いる。
質量スペクトル予測タスクにおける有望な実験結果を示す。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 00:56:23 GMT)
Learning to Discern: Imitating Heterogeneous Human Demonstrations with
Preference and Representation Learning [12.4] 本稿では、様々な品質とスタイルのデモンストレーションから学習するオフラインの模倣学習フレームワークであるL2Dについて紹介する。
本研究では,L2Dが様々な実演から効果的に評価・学習できることを示す。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 06:08:55 GMT)
REFER: An End-to-end Rationale Extraction Framework for Explanation
Regularization [12.4] 本稿では,理性抽出プロセスを通じてバックプロパゲーションを可能にする,微分可能な理性抽出器を用いたフレームワークであるREFERを提案する。
課題モデルと有理抽出器を共同で訓練することにより,トレーニング中にヒトのハイライトを用いることによる影響を分析した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 21:20:52 GMT)
Unifying O(3) Equivariant Neural Networks Design with Tensor-Network
Formalism [12.0] 本稿では,SU($2$)対称量子多体問題のシミュレーションに広く用いられている融合図を用いて,同変ニューラルネットワークのための新しい同変成分を設計する手法を提案する。
与えられた局所近傍の粒子に適用すると、結果として得られる成分は「融合ブロック」と呼ばれ、任意の連続同変関数の普遍近似として機能する。
我々のアプローチは、テンソルネットワークと同変ニューラルネットワークを組み合わせることで、より表現力のある同変ニューラルネットワークを設計するための有益な方向を示唆している。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 16:38:05 GMT)
Eliminating Label Leakage in Tree-Based Vertical Federated Learning [12.0] 我々は,各ノードに割り当てられたレコードIDの集合を利用して,プライベートトレーニングラベルを推論する新しいラベル推論攻撃ID2Graphを導入する。
本稿では,ラベルの差分プライバシーを後処理で改善するGrafting-LDPと,相互情報正規化に着目したID-LMIDの2つの効果的な防御機構を提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 11:17:52 GMT)
The Law and NLP: Bridging Disciplinary Disconnects [11.8] 法的実践におけるNLPの取り込みの遅さは、法律コミュニティのニーズとNLP研究者の焦点との切り離しによって悪化していると論じる。
我々は、学際的断線を橋渡しすることを約束する法的なNLPタスクの例を論じ、未調査のままの法的なNLP研究の興味深い領域を強調する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 16:34:31 GMT)
EViT: An Eagle Vision Transformer with Bi-Fovea Self-Attention [11.7] 視覚変換器は様々なコンピュータビジョンタスクにおいて競争性能を示した。
ワシ眼におけるBFSA(Bi-Fovea Self-Attention)の生理的構造と特徴にインスパイアされた新規なBFSA(Bi-Fovea Self-Attention)が提案されている。
本研究では,BFSAをベースとした Bionic Eagle Vision (BEV) ブロックを設計した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 09:27:51 GMT)
Learning Interpretable Rules for Scalable Data Representation and
Classification [11.4] ルールベースのLearner Representation (RRL)は、データ表現と分類のための解釈可能な非ファジィ規則を学習する。
RRLは容易に調整でき、異なるシナリオの分類精度とモデルの複雑さのトレードオフを得ることができる。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 15:55:58 GMT)
What's in a Prior? Learned Proximal Networks for Inverse Problems [11.2] 近似作用素は、逆問題においてユビキタスであり、通常は、そうでなければ不適切な問題を正則化するための戦略の一部として現れる。
現代のディープラーニングモデルは、プラグアンドプレイやディープアンロールのフレームワークのように、これらのタスクにも耐えられてきました。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 16:31:01 GMT)
QA-NatVer: Question Answering for Natural Logic-based Fact Verification [11.0] 我々は自然論理演算子を予測するために質問応答を用いることを提案する。
FEVERのいくつかの設定では、我々のアプローチは最高のベースラインを4.3ドルの精度で上回っている。
人間の評価から,本手法は,従来の自然論理に基づくシステムよりも,誤動作の少ない自然論理演算子でより妥当であることが示唆された。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 06:27:31 GMT)
SEM-GAT: Explainable Semantic Pose Estimation using Learned Graph
Attention [10.9] 本稿では,信頼度の高いポイントクラウド登録候補の識別を導くために,意味論と局所幾何学を利用したグラフニューラルネットワーク(GNN)に基づく手法を提案する。
環境のセマンティックおよび形態学的特徴は、登録のための重要な基準点として機能し、正確なライダーベースのポーズ推定を可能にする。
提案手法をKITTIオドメトリデータセット上でテストし,ベンチマーク手法と比較して競合精度が向上し,より少ないネットワークパラメータに依存しながら,トラックのスムーズさが向上した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 18:46:34 GMT)
Diffusion-Model-Assisted Supervised Learning of Generative Models for
Density Estimation [10.8] 本稿では,密度推定のための生成モデルを訓練するためのフレームワークを提案する。
スコアベース拡散モデルを用いてラベル付きデータを生成する。
ラベル付きデータが生成されると、シンプルな完全に接続されたニューラルネットワークをトレーニングして、教師付き方法で生成モデルを学ぶことができます。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 23:56:19 GMT)
An International Consortium for Evaluations of Societal-Scale Risks from
Advanced AI [10.8] 規制のギャップにより、AIラボは最小限の監視で研究、開発、デプロイメント活動を行うことができた。
フロンティアAIシステムの評価は、フロンティアAIシステムの開発と展開のリスクを評価する方法として提案されている。
本稿では,AI開発者とサードパーティのAIリスク評価者の両方からなる,AIリスク評価のための国際コンソーシアムの形でのソリューションを提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 23:37:48 GMT)
$\alpha$-Fair Contextual Bandits [10.7] コンテキストバンディットアルゴリズムは、レコメンデータシステム、臨床試験、最適なポートフォリオ選択など、多くのアプリケーションの中核にある。
文脈的バンディット文学で研究される最も一般的な問題の1つは、各ラウンドにおける報酬の合計を最大化することである。
本稿では,大域的な$alpha$-fairtextual Con Bandits問題を考える。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 03:42:59 GMT)
JOSA: Joint surface-based registration and atlas construction of brain
geometry and function [10.6] JOSAは、幾何学と関数のミスマッチを共同でモデル化する、新しい皮質登録フレームワークである。
幾何と関数の両方において最先端の手法よりも優れた登録性能を実現するが、推論時に関数データを必要としない。
脳構造と機能の共同解析を用いた登録手法の今後の発展に関する新たな知見を提供する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 02:16:48 GMT)
Reputation-Based Federated Learning Defense to Mitigate Threats in EEG
Signal Classification [10.6] 脳波データの分散特性と関連するプライバシとセキュリティ上の懸念から,脳波解析のための効率的な学習モデルを作成することは困難である。
本稿では,脳波信号分類における潜在的なセキュリティ脅威を防御する評価に基づく脅威軽減フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 08:08:15 GMT)
Unifying Data Perspectivism and Personalization: An Application to
Social Norms [10.5] 13kのアノテーションと210kの社会的規範の判断による対立に関するソーシャルメディア投稿のコーパスについて検討する。
本稿では,アノテータのモデリングにパーソナライズ手法を適用し,社会的規範の知覚を予測する上での有効性を比較した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 20:16:42 GMT)
Retrieval-Augmented Chain-of-Thought in Semi-structured Domains [10.4] 大規模言語モデル(LLM)は、印象的な言語理解とコンテキスト内学習能力を示している。
本研究は,法的・財務的データの半構造化特性を活用し,関連文脈を効率的に検索することを目的とする。
結果として得られるシステムは、現代のモデルよりも優れており、また、回答に有用な説明を提供する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 22:45:14 GMT)
MaRU: A Manga Retrieval and Understanding System Connecting Vision and
Language [10.2] MaRU (Manga Retrieval and Understanding) は、マンガフレーム内の対話とシーンの効率的な検索を容易にするために、視覚と言語を接続する多段階システムである。
MaRUのアーキテクチャは、テキストとフレーム境界ボックスを識別するオブジェクト検出モデル、テキストを埋め込むテキストエンコーダ、およびテキスト情報と視覚情報を統合してシーン検索のための統合埋め込み空間にマージするビジョンエンコーダを統合する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 05:51:02 GMT)
Prompt Engineering Through the Lens of Optimal Control [9.8] 大規模言語モデル(LLM)とのマルチラウンドインタラクションに適した最適制御フレームワークを提案する。
このフレームワークは、既存のPEメソッドを体系化するだけでなく、厳密な解析的改善の段階を設定できる統一された数学的構造を提供する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 06:34:09 GMT)
Which Prompts Make The Difference? Data Prioritization For Efficient
Human LLM Evaluation [9.5] 計量に基づく手法は,必要なアノテーションの数を最小化することで,人間の評価の効率を向上させる。
提案手法は,広く用いられているモデルファミリに対して有効であり,非決定的(あるいは"tie")な結果のインスタンスを最大54%削減できることを示す。
この人的努力の潜在的な削減は、我々のアプローチを将来の大規模言語モデル評価における貴重な戦略として位置づけている。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 21:48:51 GMT)
ITEm: Unsupervised Image-Text Embedding Learning for eCommerce [9.3] 製品埋め込みは、電子商取引における幅広い応用の基礎となる。
本稿では,画像とテキストのモダリティによく対応できる画像テキスト埋め込みモデル(ITEm)を提案する。
我々は、非常に類似した商品の探索と製品カテゴリーの予測という2つのタスクにおいて、事前訓練されたITTmを評価する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 15:39:44 GMT)
A Survey on Continual Semantic Segmentation: Theory, Challenge, Method
and Application [9.0] 継続的学習は、漸進的学習または生涯学習としても知られ、ディープラーニングとAIシステムの最前線にある。
本稿では,連続的セマンティックセグメンテーション(CSS:Continuous semantic segmentation, 連続意味セグメンテーション)について概説する。
現在のCSSモデルを、textitdata-replay と textitdata-free セットを含む2つのメインブランチに分類し、分類する。
各ブランチにおいて、対応するアプローチは類似性に基づくクラスタ化および網羅的解析であり、関連するデータセットの質的比較と定量的再現に続く。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 11:53:56 GMT)
Evaluating Robustness of Visual Representations for Object Assembly Task
Requiring Spatio-Geometrical Reasoning [8.6] 本稿では,オブジェクト・アセンブリ・タスクのコンテキストにおける視覚表現の堅牢性の評価と評価に焦点をあてる。
我々は視覚前訓練モデルを視覚エンコーダとして利用するビズモータ政策学習の一般的な枠組みを用いる。
本研究は、両腕操作装置に適用する場合、特にグリップ変動に対して、この枠組みの頑健性について検討する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 21:09:34 GMT)
Generalized Gradient Flows with Provable Fixed-Time Convergence and Fast
Evasion of Non-Degenerate Saddle Points [8.5] グラディエントベースの1次凸最適化アルゴリズムは、機械学習タスクを含むさまざまな領域で広く適用可能である。
最適時間の固定時間理論の最近の進歩に触発されて,高速化最適化アルゴリズムを設計するための枠組みを導入する。
非ド・サドル点を許容する関数に対しては、これらのサドル点を避けるのに必要な時間は初期条件すべてに一様有界であることを示す。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 08:17:03 GMT)
SSL4EO-L: Datasets and Foundation Models for Landsat Imagery [8.3] ランドサット計画 (Landsat program) は、過去最長の地球観測計画であり、8つの衛星による50年以上のデータ取得である。
深層学習やリモートセンシングの普及にもかかわらず、ほとんどの研究者はランドサットの画像解析に決定木とランダムな森林を使っている。
本稿では,ランドサット衛星群を対象としたセルフ・スーパーバイザード・ラーニング・フォー・アース・オブ・オブ・アース・オブ・ザ・観察のために設計された最初のデータセットであるSSL4EO-Lを紹介する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 13:59:26 GMT)
A Quantitative Evaluation of Dense 3D Reconstruction of Sinus Anatomy
from Monocular Endoscopic Video [8.3] 内視鏡的シーケンスと光学的トラッキングを用いた洞再建のための自己教師型アプローチの定量的解析を行った。
以上の結果から, 生成した復元は解剖学的に高い一致を示し, 平均点間誤差は0.91mmであった。
ポーズと深さ推定の不正確さがこの誤りに等しく寄与し、より短い軌跡を持つ局所的に一貫したシーケンスがより正確な再構成をもたらすことを確認した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 17:11:40 GMT)
ObVi-SLAM: Long-Term Object-Visual SLAM [8.1] 既存のビジュアルSLAMアプローチは、環境変化に対して堅牢でない低レベルの特徴記述子に依存している。
ObVi-SLAMは、高品質の短期視覚計測に低レベルの視覚的特徴を使用する。
ObVi-SLAMは永続オブジェクトの不確実性を認識した長期マップを構築し、デプロイ毎に更新する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 21:10:47 GMT)
Hyp-UML: Hyperbolic Image Retrieval with Uncertainty-aware Metric
Learning [8.0] メトリクス学習は画像検索と分類の訓練において重要な役割を果たしている。
双曲的埋め込みは階層的なデータ構造を表現するのにより効果的である。
本稿では,一般的なコントラスト学習と従来のマージンに基づく距離学習の2種類の不確実性を考慮した距離学習を提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 03:42:14 GMT)
4 and 7-bit Labeling for Projective and Non-Projective Dependency Trees [7.5] 我々は,任意の射影依存木を4ビットラベルの列として表現できるシーケンスラベリングとして解析用エンコーディングを導入する。
木バンクの多種多様化の結果から,従来で最も性能のよいシーケンスラベリング符号化よりも精度の高い7ビット符号化が得られた。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 14:43:53 GMT)
Neural Sampling in Hierarchical Exponential-family Energy-based Models [7.4] 本稿では,推論と学習のダイナミクスを捉える階層的指数族エネルギーベース(HEE)モデルを提案する。
我々は、神経適応が運動量項として機能し、推論過程を著しく加速することを示した。
機械学習のコミュニティにとって、我々のモデルは共同生成や限界生成によって観察を生成できる。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 08:00:30 GMT)
PulmoBell: Home-based Pulmonary Rehabilitation Assistive Technology for
People with COPD [7.1] 肺再生 (PR) は, COPD を安定的に維持する手段の1つである。
英国におけるPRの実施は、患者が直面している環境と個人の障壁のために困難である。
筆者らは, センサ型補助製品の新規設計について提案し, 住宅環境におけるPRの促進とPA維持の促進をめざして提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 16:23:56 GMT)
Value of Assistance for Grasping [7.0] 我々は,ロボットが把握を成功させる能力に対して,特定の観察が期待する効果を評価するために,新しいVOA(Value of Assistance)尺度を提供する。
シミュレーションと実世界のロボット設定の両方において提案手法を評価した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 20:25:08 GMT)
Skipped Feature Pyramid Network with Grid Anchor for Object Detection [7.0] 特徴ピラミッドの各レベルにおいてより強力な意味論を得るために,スキップ接続を提案する。
提案手法では,各レベルが一定スケールの物体を検知する責任を負うことがより合理的である。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 23:27:05 GMT)
Excited stated quantum phase transitions and the entropy of the work
distribution in the anharmonic Lipkin-Meshkov-Glick model [6.5] 本研究では、無調波リプキン-メシュコフ-グリック(LMG)モデルにおける励起状態量子相転移(ESQPT)の影響と特性について検討する。
作業分布のエントロピーは、作業分布の複雑さを測定し、非平衡作業統計を分析する貴重なツールとして振る舞う。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 12:34:21 GMT)
Right, No Matter Why: AI Fact-checking and AI Authority in
Health-related Inquiry Settings [6.5] 健康関連文の真偽を評価する際に,ユーザのAI対応行動の評価を行う。
AIはステートメントが偽/真であると信じている”というだけに制限されたフィードバックでさえ、半数以上の人がステートメントアセスメントをAIの提案に移行していることがわかったのです。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 16:59:31 GMT)
Knowledge Distillation $\approx$ Label Smoothing: Fact or Fallacy? [6.3] トレーニングしたモデルの予測的信頼度を比較することで,手法間の等価性を再検討する。
ほとんどの設定では、KDとLSは完全に反対方向にモデルの信頼性を駆動する。
KDでは、学生は知識だけでなく教師からの信頼も受け継ぎ、古典的な知識伝達の視点を強化している。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 02:49:54 GMT)
TATA: Stance Detection via Topic-Agnostic and Topic-Aware Embeddings [6.1] 我々は、下流姿勢検出に使用するトピック認識/TAGとトピック認識/TAW埋め込みを訓練する。
いくつかの公開姿勢検出データセットで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 23:23:44 GMT)
Exploring Effective Distillation of Self-Supervised Speech Models for
Automatic Speech Recognition [5.8] SSLモデルの小型化は、実用価値の重要な研究方向となっている。
自動音声認識(ASR)のための HuBERT-based SSL モデルの有効蒸留について検討する。
特に低資源シナリオにおいて, 蒸留性能を高めるために, HuBERT の差別的損失を導入した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 13:03:09 GMT)
Theory of Mind for Multi-Agent Collaboration via Large Language Models [5.5] 本研究では,多エージェント協調型テキストゲームにおけるLarge Language Models (LLMs) ベースのエージェントを,理論オブマインド (ToM) 推論タスクを用いて評価する。
LLMをベースとしたエージェント間の創発的協調行動と高次マインド理論の実証を行った。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 03:49:34 GMT)
On the Fine-Grained Query Complexity of Symmetric Functions [5.0] 本稿では、Watrous予想のきめ細かいバージョンについて考察する。
確率が任意に1/2ドルに近いランダム化および量子化アルゴリズムを含む。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 02:38:07 GMT)
Optimal Sensing Protocol for Statistically Polarized Nano-NMR with NV
Centers [4.9] 位相感度プロトコルは、ほとんどの実験シナリオにおいて優れていることを示す。
現在までに最も正確な統計偏光ナノNMRQdyne検出実験を行っている。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 14:33:14 GMT)
Inhomogeneous polarization evolution resolves a fundamental issue in
non-Hermitian transverse optical beam shifts [4.7] 部分反射の場合、ビームの運動量領域の不均一偏光進化は、横シフト作用素の対応する固有スペクトルにおける全ての特異点の中心にある。
これらの知見は、新しい非エルミートスピン軌道フォトニクスの概念を提唱し、共通偏光光学素子をPT対称非エルミート系として機能させることを可能にした。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 07:16:03 GMT)
Research on Key Technologies of Infrastructure Digitalization based on
Multimodal Spatial Data [4.6] レーザスキャナーによって収集された点雲のいくつかの主要な特徴を要約し、ネットワーク構築の潜在的な問題を解析する。
道路標識検出の問題を解決するため,情報密度を高めることにより,地中雲内のリモートセンシングデータを最適化する。
リアルタイムディジタルツイントラヒックでは,MPR-GANのバックボーンを2次元特徴生成用として,SuperGlueを2次元特徴マッチング用として,P2PRNネットワークを設計する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 13:26:39 GMT)
MoPe: Model Perturbation-based Privacy Attacks on Language Models [4.5] 大規模言語モデル(LLM)は、トレーニングデータに存在する機密情報を意図せずにリークすることができる。
本稿では,事前学習した言語モデルのトレーニングデータに含まれるテキストを高い信頼度で識別する新しい手法であるモデル摂動(MoPe)を提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 17:33:19 GMT)
Benchmarking Quantum Surrogate Models on Scarce and Noisy Data [4.4] 量子ニューラルネットワーク (QNN) は, 希少かつノイズの多いデータの存在下で, 従来のアナログよりも優れている可能性が示された。
我々のコントリビューションは、QNNを高次元の実世界データ上の代理モデルとして使う最初のアプリケーション中心のアプローチを示す。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 16:22:03 GMT)
Are LSTMs Good Few-Shot Learners? [4.3] 2001年、Hochreiterらは、異なるタスクにまたがってバックプロパゲーションで訓練されたLSTMがメタラーニングを行うことができることを示した。
このアプローチを再検討し、現代の数ショットの学習ベンチマークでテストします。
LSTMは、単純な数ショットの正弦波回帰ベンチマークでMAMLよりも優れているが、予想されることに、より複雑な数ショット画像分類ベンチマークでは不足している。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 00:16:30 GMT)
Assessment of IBM and NASA's geospatial foundation model in flood
inundation mapping [4.3] そこで本稿は,IBM-NASAのPrithviによる地空間基盤モデルの性能評価を行い,地空間解析の重要課題である洪水浸水マッピングを支援する。
実験では、ベンチマークデータセットであるSen1Floods11を使用し、モデルの予測可能性、一般化可能性、転送可能性を評価する。
以上の結果から, プリスヴィモデルでは, 未確認領域のセグメンテーションにおいて, 性能上の優位性が示された。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 22:05:54 GMT)
A Pytorch Reproduction of Masked Generative Image Transformer [4.2] PyTorch を用いた MaskGIT: Masked Generative Image Transformer の再現について述べる。
このアプローチでは、マスク付き双方向トランスフォーマーアーキテクチャを活用することで、わずか数ステップで画像生成を可能にする。
本研究は,本論文で提示した結果と密接に一致した結果を得る。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 20:21:11 GMT)
Attacks Meet Interpretability (AmI) Evaluation and Findings [4.0] 我々は,2つの論文,Attacks Meet Interpretability: Attribute-steered Detection of Adversarial Samples and Is AmI (Attacks Meet Interpretability) Robust to Adversarial Examplesの結果を再現する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 22:41:19 GMT)
URegM: a unified prediction model of resource consumption for
refactoring software smells in open source cloud [4.0] 我々は、コードの臭いがクラウドリソースの利用に与える影響を予測する、Unified Regression Modelling (URegM) というフレームワークを提案する。
その結果,URegMはコードの臭いによる資源消費を正確に予測できることがわかった。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 23:03:35 GMT)
Qualitative analysis of the relationship between design smells and
software engineering challenges [4.0] 本研究は,大量のソースコードを解析することにより,Javaソフトウェアの設計臭い検出に使用するツールを提供する。
ツールの出力に基づいて、検出された設計の臭いの原因を「不規則なチームミーティング」と「スコープクリープ」という2つのソフトウェアエンジニアリング課題に関連付ける研究を行った。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 23:21:13 GMT)
Rethinking Certification for Trustworthy Machine Learning-Based
Applications [3.9] 機械学習(ML)は、非決定論的振る舞いを持つ高度なアプリケーションの実装にますます使われています。
既存の認証スキームは、MLモデル上に構築された非決定論的アプリケーションにはすぐには適用されない。
本稿では、現状の認定制度の課題と欠陥を分析し、オープンな研究課題について論じ、MLベースのアプリケーションのための最初の認定制度を提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 19:31:17 GMT)
Is ChatGPT a game changer for geocoding -- a benchmark for geocoding
address parsing techniques [3.8] 実運用におけるジオコーディングシステムの実際の入力ログから抽出した人間の入力パターンに基づいて合成された低品質アドレス記述のベンチマークデータセットを提案する。
このデータセットには21の異なる入力エラーとバリエーションがあり、アメリカ50州とワシントンD.C.の通りから一意に選択された239,000以上のアドレス記録が含まれている。
アドレス成分抽出におけるGPT-3モデルの性能を,トランスフォーマーベースモデルとLSTMベースモデルとを比較して評価する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 17:03:56 GMT)
ConViViT -- A Deep Neural Network Combining Convolutions and Factorized
Self-Attention for Human Activity Recognition [3.6] RGBビデオを用いた行動認識のためのハイブリッドアーキテクチャにおいて,CNNとトランスフォーマーの長所を生かした新しい手法を提案する。
我々のアーキテクチャは, HMDB51, UCF101, ETRI-Activity3Dで90.05 %, 99.6%, 95.09%のSOTA結果を得た。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 21:13:43 GMT)
MMTF-DES: A Fusion of Multimodal Transformer Models for Desire, Emotion,
and Sentiment Analysis of Social Media Data [3.6] デザール(Desire)とは、人間の感情や行動を促進する言語的・認知的な側面を構成する人間の願望と願望の集合である。
我々は、人間の欲求、感情、感情を識別するための画像テキストペア設定を備えた統合マルチモーダルトランスフォーマーベースのフレームワークを提案している。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 00:43:06 GMT)
Domain Terminology Integration into Machine Translation: Leveraging
Large Language Models [3.2] 本稿では,WMT 2023 におけるドイツ語-英語(DE-EN),英語-チェコ語(EN-CS),中国語-英語(ZH-EN)言語対に対する提案手法について述べる。
この課題は、技術用語を正確に翻訳するシステムを開発するために参加者に挑戦することで機械翻訳(MT)を進めることを目的としている。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 23:25:28 GMT)
Neural Text Sanitization with Privacy Risk Indicators: An Empirical
Analysis [2.9] テキスト・サニタイズのための2段階のアプローチを検討し、その経験的性能を詳細に分析する。
テキストサニタイズプロセスは、プライバシー指向のエンティティ認識器から始まり、識別可能な個人情報を表すテキストを識別する。
本稿では,言語モデルの確率,テキストスパン分類,シーケンスラベリング,摂動,Web検索に基づく再識別リスクの指標を5つ提示する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 14:17:27 GMT)
Boosting Unsupervised Machine Translation with Pseudo-Parallel Data [2.9] 本研究では,モノリンガルコーパスから抽出した擬似並列文対と,モノリンガルコーパスから逆転写された合成文対を利用する訓練戦略を提案する。
裏書きされたデータのみに基づいてトレーニングされたベースラインに対して、最大14.5 BLEUポイント(ウクライナ語)の改善を達成しました。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 10:57:12 GMT)
Learning to bag with a simulation-free reinforcement learning framework
for robots [2.8] 本稿では,ロボットがバッグングを学習できる,効率的な学習ベースのフレームワークを提案する。
このフレームワークの新規性は、シミュレーションに頼らずにバッグングを行う能力である。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 20:19:43 GMT)
Mobile Traffic Prediction at the Edge through Distributed and Transfer
Learning [2.7] このトピックの研究は、異なるネットワーク要素からデータを収集することによって、中央集権的な予測を行うことに集中している。
本研究では,エッジ上で得られたデータセットを大規模計測キャンペーンで活用するエッジコンピューティングに基づく新しい予測フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 23:48:13 GMT)
Enhancing Accuracy-Privacy Trade-off in Differentially Private Split Learning [2.3] Split Learning(SL)は、クライアントサーバ間で詳細なモデルを分散し、プライベートデータをローカルに保持することで、ユーザのデータプライバシを保護することを目的としている。
最近提案されたモデル反転攻撃は、スマッシュされたデータから元のデータを復元することができる。
ディファレンシャルプライバシ(DP)を採用する戦略では、スマッシュされたデータをある程度の精度の損失を犠牲にして保護する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 22:45:13 GMT)
RSM-NLP at BLP-2023 Task 2: Bangla Sentiment Analysis using Weighted and
Majority Voted Fine-Tuned Transformers [2.0] 本稿では,BLP Workshop - Sentiment Analysis of Bangla Social Media Postsで行った投稿に対するアプローチについて述べる。
マルチクラス分類タスクでは0.711, 共有タスクでは10位となった。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 10:55:56 GMT)
An extremely bad-cavity laser [2.0] バッドキャビティ・レシエーションの遅延は精度測定に有望な応用がある。
細粒度が2の限界に近い空洞からの出力が実験的にアクセスされたことはない。
レーザーの出力は数十ドル(約10万円)程度で、スペクトル線幅はゲインバンド幅の1000倍以上の数kHzに達する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 09:25:46 GMT)
Gasper: GrAph Signal ProcEssing in R [1.8] 本稿では,proglangR Gasperパッケージの使用に関する簡単なチュートリアルを紹介する。
Gasperはグラフ上の信号処理専用のパッケージである。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 14:00:12 GMT)
Cooperative Minibatching in Graph Neural Networks [1.5] 近隣爆発現象(NEP)の低減を目的とした協調的最小化手法を提案する。
本研究では, 連続したミニバッチを生成することで, 連続実行において同じ現象を利用する方法を示す。
単一ノードのマルチGPUシステム上では,Independent Minibatchよりも最大64%の高速化を実現しています。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 02:01:01 GMT)
A Novel Quasiparticle Method for Solid State Ion Transport [1.5] 準粒子法は固体電子と結晶格子振動において大きな成功を収めた。
従来の固体イオン系と短距離イオンイオンの反発を準粒子量子系にマッピングする一般的なレシピが提案されている。
誘導されるイオン固有状態と輸送は、自然に結合した挙動を組み込むことができる。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 20:34:13 GMT)
VECHR: A Dataset for Explainable and Robust Classification of
Vulnerability Type in the European Court of Human Rights [1.4] VECHRは,脆弱性型分類と説明的根拠に基づく,新たな専門家によるマルチラベルデータセットである。
予測可能性と説明可能性の両方の観点から,VECHRの最先端モデルの性能をベンチマークする。
当社のデータセットは、パフォーマンス、説明可能性、堅牢性に関する大幅な改善の余地を提供する、ユニークな課題を呈しています。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 19:50:26 GMT)
DePAint: A Decentralized Safe Multi-Agent Reinforcement Learning
Algorithm considering Peak and Average Constraints [1.3] 本稿では分散環境でのマルチエージェントポリシー最適化の問題に対処する。
モーメントに基づく分散型政策勾配法であるDePaintを提案し,その解法を提案する。
私たちの知る限りでは、これは、ピークと平均的な制約の両方を考慮に入れた、プライバシ保護で完全に分散化されたマルチエージェント強化学習アルゴリズムとしては初めてのものです。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 16:36:03 GMT)
Item-Graph2vec: a Efficient and Effective Approach using Item
Co-occurrence Graph Embedding for Collaborative Filtering [1.2] 現在, Item2vec などの人工ニューラルネットワークに基づく協調フィルタリングアルゴリズムが普及しており, 現代のレコメンデータシステムに広く応用されている。
大規模データセットを扱う場合、現在のアルゴリズムがトレーニング時間コストが高く、安定性が低いという欠点を克服するため、アイテムグラフ埋め込みアルゴリズムであるItem-Graph2vecについて説明する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 07:46:31 GMT)
Reducing the False Positive Rate Using Bayesian Inference in Autonomous
Driving Perception [1.2] 本稿では, 偽陽性率(FPR)の低減を目的とした多感覚・多モーダリティ手法を用いて, 物体認識について検討する。
FPRの低減は、物体の誤分類が事故を引き起こす可能性があるため、認識システムにおいてますます重要になる。
本研究では、ガウス核密度推定から累積分布関数としての確率関数と正規化ヒストグラムの累積関数としての事前確率を考慮し、ベイズ推定によるFPRの低減戦略を示す。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 21:19:48 GMT)
Data Augmentation: a Combined Inductive-Deductive Approach featuring
Answer Set Programming [1.1] 本稿では,高度なデータ拡張技術を用いて,フォトリアリスティック画像の合成を行うフレームワークを提案する。
得られたラベル付き画像は、生成されたラベルに準拠した写真リアルな画像を作成するためのDeep Learningに基づく専用プロセスを実行する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 21:02:26 GMT)
Toward Flare-Free Images: A Survey [1.1] レンズフレア(Lens flare)は、画像の品質を著しく低下させ、コンピュータビジョンシステムの性能に影響を与えることができる人工物である。
この調査は、内部反射、散乱、回折、およびカメラレンズシステム内の分散などの要因から生じる、フレア形成の複雑な光学を掘り下げる。
この調査は、ハードウェア最適化戦略、古典的な画像処理技術、ディープラーニングを用いた学習手法など、フレア除去のための幅広い手法を幅広くカバーしている。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 16:46:12 GMT)
Guidance system for Visually Impaired Persons using Deep Learning and
Optical flow [1.1] 視覚障害者は、道路を歩いている間、周囲について知ることは困難です。
彼らによって使用される歩行棒は、スティックの近接する障害物に関する情報しか得られない。
本稿では,にぎやかな通りで案内する方法を紹介する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 09:24:57 GMT)
Guided Frequency Loss for Image Restoration [1.0] 本稿では、画像の周波数内容と空間的コンテンツとをバランスよく学習するのに役立つガイド周波数損失(GFL)を提案する。
学習効率を高めるために並列に動作する3つの主要なコンポーネントを集約する。
その結果、ほとんどの実験でGFL損失はPSNR測定値を改善した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 06:36:41 GMT)
A bound on approximating non-Markovian dynamics by tensor networks in
the time domain [1.0] 時間計算資源を用いて,スピンボソンモデルを効率的にシミュレーションできることを示す。
この境界は、スピンボソンモデルが時間計算資源を用いて効率的にシミュレートできることを示している。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 17:47:11 GMT)
From Ergodicity to Many-Body Localization in a One-Dimensional
Interacting Non-Hermitian Stark System [0.7] 時間-逆対称性を持つ非相互ホッピングを持つ1次元相互作用するスタークモデルを考える。
我々は、非エルミートスタークMBLが堅牢であることを示し、障害誘発MBLと多くの類似点を共有している。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 13:40:34 GMT)
Random Projection Forest Initialization for Graph Convolutional Networks [0.7] グラフ畳み込みネットワーク(GCN)は、グラフのような非構造化データにディープラーニングを拡張するための大きなステップであった。
ランダムプロジェクションフォレスト(rpForest)を用いたグラフの構築とGCNの初期化を行う新しい方法を提案する。
rpForestを使えば、さまざまな重要度を示すエッジに様々な重みを割り当てることができ、学習が促進されます。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 05:43:36 GMT)
Duality analysis in symmetric group and its application to random tensor
network model [0.7] 双対性解析は自然に、$Z(q)$対称性とランダムスピン系を持つ自由度の場合に一般化することができる。
対称群の置換モデルは、ランダム量子回路とランダムテンソルネットワークモデルと密接に関連している。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 00:18:42 GMT)
A generalized likelihood-weighted optimal sampling algorithm for
rare-event probability quantification [0.5] 本稿では,レアイベント統計を効率的に定量化するためのシーケンシャルサンプリングのための新しい取得関数を提案する。
さらに,モンテカルロにおける獲得関数の離散的最適化に重要な手順を開発する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 23:51:54 GMT)
MMGP: a Mesh Morphing Gaussian Process-based machine learning method for
regression of physical problems under non-parameterized geometrical
variability [0.3] 本稿では,グラフニューラルネットワークに依存しない機械学習手法を提案する。
提案手法は, 明示的な形状パラメータ化を必要とせずに, 大きなメッシュを容易に扱うことができる。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 14:36:46 GMT)
Cross-Domain HAR: Few Shot Transfer Learning for Human Activity
Recognition [0.3] 本稿では,HARデータセットを有効な転送学習に利用するための経済的なアプローチを提案する。
本稿では,教師が学習する自己学習パラダイムに則って,新たな伝達学習フレームワークであるクロスドメインHARを紹介する。
本手法の有効性を,撮影活動認識のシナリオで実証する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 19:13:25 GMT)
Meta-Referential Games to Learn Compositional Learning Behaviours [0.2] 構成学習行動(CLB)の学習における中心的な問題は、結合問題(BP)の解決である。
本稿では,BPのドメインに依存しないバージョンを解くことにより,CLBを提示するエージェントの能力を調べるベンチマークを提案する。
我々は、我々のベンチマークが魅力的な課題であることを示すベースラインの結果とエラー分析を提供し、研究コミュニティがより有能な人工エージェントを開発するよう促すことを願っている。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 08:17:17 GMT)
Augmenting End-to-End Steering Angle Prediction with CAN Bus Data [0.2] 車両のCANバスデータと映像データとを融合させてコンピュータビジョンモデルの精度を向上させる。
CANバスデータを使わずにモデルをトレーニングしたとき,CANバスデータでトレーニングしたモデルは0.02492のRMSEを得たが,CANバスデータでトレーニングしたモデルは0.01970のRMSEを得た。
この結果は、CANバスデータをビデオデータと融合することで、コンピュータビジョンモデルの予測誤差を20%削減し、一部のモデルではエラーを80%削減できることを示している。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 03:24:53 GMT)
Towards Harmful Erotic Content Detection through Coreference-Driven
Contextual Analysis [0.0] 本稿では,エロティックコンテンツ中の有害な文脈的手がかりを特定するための,ニューラルネットワークとルールベースのコンテキスト認識システムを提案する。
ポーランド語テキストでテストした本モデルでは,84%の有望な精度と80%のリコールが得られた。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 15:19:04 GMT)
Tight inequalities for nonclassicality of measurement statistics [0.0] 量子光学では、測定統計が古典的放射場の統計的混合で再現できない場合、非古典的とみなされる。
我々はそのような非古典主義に必要かつ十分な条件を定式化した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 10:58:48 GMT)
The Importance of Anti-Aliasing in Tiny Object Detection [0.0] 本稿では,小さな物体検出に対するアンチエイリアスのための既存のWaveCNetを適用した。
We modified the original WaveCNet to apply Wavelet Pooling layer, effectively suppressing aliasing。
また,背骨の底面重みのあるバージョンを提案し,小型物体検出の性能をさらに向上させる。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 08:02:01 GMT)
Source Separation of Unknown Numbers of Single-Channel Underwater
Acoustic Signals Based on Autoencoders [0.0] ソース分離問題に対処するために,一定数の出力チャネルを持つ解を提案する。
具体的には、オートエンコーダに基づく2段階のアルゴリズムと、ミュートチャネルのある状況に対する新しい性能評価手法を提案する。
放射音の混合を模擬した実験により, 提案手法は, 既知信号数と同等の分離性能が得られることを示した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 14:49:58 GMT)
Shallow Depth Factoring Based on Quantum Feasibility Labeling and
Variational Quantum Search [0.0] 整数分解は、特に量子コンピューティングの文脈において顕著な研究課題である。
本稿では,新しい量子アルゴリズムShallow Depth Factoring (SDF)を提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 02:42:52 GMT)
SeUNet-Trans: A Simple yet Effective UNet-Transformer Model for Medical
Image Segmentation [0.0] 医用画像セグメンテーションのためのシンプルなUNet-Transformer(seUNet-Trans)モデルを提案する。
提案手法では,UNetモデルを特徴抽出器として設計し,入力画像から複数の特徴マップを生成する。
UNetアーキテクチャと自己認識機構を活用することで、我々のモデルはローカルとグローバルの両方のコンテキスト情報を保存するだけでなく、入力要素間の長距離依存関係もキャプチャする。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 16:09:39 GMT)
Randomized Forward Mode of Automatic Differentiation for Optimization
Algorithms [0.0] 本稿では,損失関数の方向微分を用いてニューラルネットワークのパラメータを更新する遺伝的ランダム化手法を提案する。
勾配の分布は、ニューラルネットワークの前方通過中に実行される。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 04:02:39 GMT)
Quantum search by continuous-time quantum walk on t-designs [0.0] 本研究は、連続時間量子ウォークを用いて、複数のマークされた要素を持つ$t$-designs上の量子検索アルゴリズムの時間的複雑さについて検討する。
ランダムウォークに基づく探索アルゴリズムと比較して,成功に導かれる二部グラフのサブセットを同定する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 00:37:52 GMT)
Quantum Walk Search in Motion [0.0] 量子ウォーク探索アルゴリズム(quantum walk search algorithm)は、グラフ内の固定されたノードを探索するために設計されている。
我々は、マークされたノードにラベルをつけるために追加の量子状態を導入し、そのアルゴリズムを拡張して2次元表面上で動く粒子を追跡する。
このコンセプトは、リアルタイムオブジェクトトラッキングからネットワーク管理やルーティングまで、さまざまなアプリケーションに対して約束されている。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 16:33:46 GMT)
Pyramidal Hidden Markov Model For Multivariate Time Series Forecasting [0.0] 隠れマルコフモデル(HMM)は、その現在の値と以前の値に基づいて時系列の将来値を予測することができる。
本稿では,複数の多段階状態をキャプチャ可能なピラミッド隠れマルコフモデル(PHMM)を提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 16:17:24 GMT)
Prepotential Approach: a unified approach to exactly, quasi-exactly, and
rationally extended solvable quantal systems [0.0] ポテンシャル的アプローチ(prepotential approach)と呼ばれる、単純で統一的な方法の概要を簡潔に説明する。
1次元シュラー・オーディンガー方程式の正確な解法と準コンパクト解法の両方を扱う。
我々は、実エネルギーを持つエルミートおよび非エルミートハミルトンのいくつかのパラダイム的な例によるアプローチを説明する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 11:40:00 GMT)
Point Cloud Denoising and Outlier Detection with Local Geometric
Structure by Dynamic Graph CNN [0.0] ポイントクラウドは3D空間のメディアフォーマットとして注目されている。
PointCleanNetは、ポイントクラウドのデnoisingとoutlier Detectionに有効な方法である。
動的グラフCNNに基づいて設計された2種類のグラフ畳み込み層を提案する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 02:03:34 GMT)
Not wacky vs. definitely wacky: A study of scalar adverbs in pretrained
language models [0.0] BERT、RoBERTa、GPT-3といった現代の事前訓練された言語モデルは、古典的な静的単語の埋め込みよりも論理的なタスクでより良いパフォーマンスを期待している。
本稿では,BERT,RoBERTa,GPT-2,GPT-3が,これらの共通語に対する一般人的な知識を示す範囲について検討する。
論理的な意味のいくつかの側面を捉えているにもかかわらず、モデルは人間のパフォーマンスにかなり劣っていることが分かりました。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 17:06:35 GMT)
Multi-charged moments and symmetry-resolved R\'enyi entropy of free
compact boson for multiple disjoint intervals [0.0] 自由コンパクトなボソンの多重荷電モーメントと対称性分解されたR'enyiエントロピーを、多重不整合区間に対して検討した。
R'enyi エントロピーは理論の局所共形代数に敏感である。
厳密な結合モデルに対して数値的に結果を確認します。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 05:24:41 GMT)
Mathematical structure of perfect predictive reservoir computing for
autoregressive type of time series data [0.0] RCニューラルネットワークの数学的構造の研究は、最近始まったばかりである。
RCニューラルネットワークにおける入力および繰り返し重み行列の隠れ構造を明らかにする。
これらの構造は,ARタイプの時系列データの予測に最適であることを示す。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 01:43:56 GMT)
Large Language Models are biased to overestimate profoundness [0.0] 本研究は, GPT-4 およびその他の様々な大規模言語モデル (LLM) を用いて, 日常的, 動機的, 疑似発声文の深度を判定する。
その結果, LLM と人間の間には, 文の種類やプロンプト技術によらず, 有意なステートメントとステートメントの相関関係が認められた。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 21:33:50 GMT)
Investigate how developers and managers view security design in software [0.0] 私たちは7人の開発者と2人のマネージャのチームに対してインタビューを行い、彼は2つのチームで実際のソフトウェアプロダクトを開発しました。
我々は,マルウェアによる攻撃が成功した理由に関する彼らの見解を入手し,セキュリティに関して考慮すべき重要な側面について推奨した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 22:44:02 GMT)
Imperceptible CMOS camera dazzle for adversarial attacks on deep neural
networks [0.0] 我々は、光源を用いてローリングシャッターでCMOSカメラをダッズする可視光対向攻撃を提案する。
本稿では、被写体に印加されたディープニューラルネットワークを騙すのに十分なジャムを施しながら、攻撃光源を完全に見えなくするために必要な写真条件を示す。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 09:44:59 GMT)
Impact of dephasing on non-equilibrium steady-state transport in
fermionic chains with long-range hopping [0.0] 一次元格子上での非相互作用フェルミオンの非平衡定常輸送特性に対するデフォーカスの影響について検討する。
対数から非平衡定常状態抵抗におけるシステムサイズ依存性へのクロスオーバーは、$alpha$が$alpha leq 1$から$alpha lesssim 1.5$に変化するときに見つかる。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 15:36:30 GMT)
Finding Vulnerabilities in Mobile Application APIs: A Modular Programmatic Approach [0.0] アプリケーションプログラミングインタフェース(API)は、さまざまなモバイルアプリケーションでデータを転送するのにますます人気になっている。
これらのAPIはエンドポイントを通じてセンシティブなユーザ情報を処理します。
本稿では,様々なモバイルAndroidアプリケーションの情報漏洩を分析するために,モジュール型エンドポイント脆弱性検出ツールを開発した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 00:08:51 GMT)
Evaluating the Code Quality of AI-Assisted Code Generation Tools: An
Empirical Study on GitHub Copilot, Amazon CodeWhisperer, and ChatGPT [0.0] AI支援のコード生成ツールは、ソフトウェア工学でますます普及している。
これらのツールの有名な例としては、GitHub Copilot、Amazon CodeWhisperer、OpenAIのChatGPTがある。
本研究の目的は,これらの著名なコード生成ツールのパフォーマンスを,コード品質指標の観点から比較することである。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 01:48:39 GMT)
Emergent phenomena in Nature: a paradox with Theory? [0.0] 自然界において、実物質を記述する有限量子系は明らかにそのような効果を示す。
本稿では、これらのパラドキカル現象を論じ、理論と現実の両方を包含する様々な概念とメカニズムを概説する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 13:36:53 GMT)
Deep MDP: A Modular Framework for Multi-Object Tracking [0.0] 本稿では,Multi-Object Tracking (MOT) のための高速かつモジュラーなフレームワークを提案する。
Deep MDPには大きなコードベースがあり、コミュニティが新しいアイデアを試したり、簡単に使いやすく、どんなMOTアプリケーションにも適応できるシステムを持つことに役立ちます。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 13:17:37 GMT)
Clustering the Sketch: A Novel Approach to Embedding Table Compression [0.0] Clustered Compositional Embeddings (CCE)は、量子化のようなクラスタリングベースの圧縮と、コードブックと、The Hashing Trickのような動的メソッドを組み合わせる。
CCEは両方の世界の長所を達成している: コードブックベースの量子化の圧縮率が高いが、*動的に*ハッシュベースのメソッドのように、トレーニング中に使用することができる。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 02:42:20 GMT)
Clustering Students Based on Gamification User Types and Learning Styles [0.0] 使用したデータはトルコの州立大学に入学した251人の学生で構成されている。
学生をグループ化する際、K-meansアルゴリズムはクラスタリングアルゴリズムとして利用されてきた。
最も高いシルエット係数は0.12であり、結果が中立であるが満足できるものではない。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 22:30:35 GMT)
Chainpoll: A high efficacy method for LLM hallucination detection [0.0] そこで我々はChainPollという幻覚検出手法を紹介した。
我々はまた、最近の研究から幻覚検出指標を評価するためのベンチマークデータセットの洗練されたコレクションであるRealHallも公開した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 14:45:14 GMT)
Can strong structural encoding reduce the importance of Message Passing? [0.0] 本研究では,強い構造符号化を行う場合のメッセージパッシングの寄与について検討する。
テンソル積に基づく特徴情報と構造情報の相互作用をモデル化する新しい手法を提案する。
以上の結果から,テンソルベースエンコーディングは少なくとも連結ベースエンコーディングと同等であることがわかった。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 16:29:44 GMT)
Can language models learn analogical reasoning? Investigating training
objectives and comparisons to human performance [0.0] 我々は、基本的なアナロジー推論を学習するいくつかの方法を試し、特に人間のアナロジー推論を評価するために使われるものよりも典型的なアナロジーに焦点をあてる。
実験の結果,少量のデータであっても,モデルが類似推論を学習できることが判明した。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 09:17:30 GMT)
Boundary scattering tomography of the Bose Hubbard model on general
graphs [0.0] 本稿では,Bose-Hubbard Hamiltonianによって記述できる量子シミュレータのトモグラフィー手法を提案する。
シミュレータのオンサイト反発をオン/オフする追加の能力により、ハミルトニアンパラメータが標準量子限界を超えていることが示される。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 05:42:48 GMT)
Bi-Encoders based Species Normalization -- Pairwise Sentence Learning to
Rank [0.0] 本稿では、名前付きエンティティ正規化のための新しい深層学習手法を提案し、問題をランク付けするペアワイズ学習として扱う。
本研究は,種の実体型に関する実験を行い,その手法を最先端技術に対して評価する。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 17:30:16 GMT)
Automated Localization of Blood Vessels in Retinal Images [0.0] 健康な網膜像と不健康な網膜像の両方を扱う2つの方法を分析した。
最初のステップでは、明るい病変の影響を減らすためにアルゴリズムが使用される。
第2のステップでは、ライン状の血管構造を局在させるために、マルチスケールのライン演算子が使用される。
論文参考訳(メタデータ) (Sun, 22 Oct 2023 21:05:55 GMT)