Chameleon: Plug-and-Play Compositional Reasoning with Large Language
Models [195.7] 大規模言語モデル(LLM)は、様々な自然言語処理タスクの解決において顕著な進歩を遂げている。
LLMは、最新の情報にアクセスできないため、固有の制限がある。
本稿では,LLMを合成推論のためのプラグアンドプレイモジュールで拡張するAIシステムChameleonを紹介する。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:52:19 GMT)
DoReMi: Optimizing Data Mixtures Speeds Up Language Model Pretraining [172.3] ミニマックス最適化(DoReMi)を用いたドメイン再重み付けを提案する。
DoReMiはまず、ドメイン上のグループ分散ロバスト最適化(Group DRO)を使用して小さなプロキシモデルをトレーニングし、ドメイン重みを生成する。
次に、これらのドメインウェイトでデータセットを再サンプリングし、より大きなフルサイズのモデルをトレーニングします。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:13:10 GMT)
DSEE: Dually Sparsity-embedded Efficient Tuning of Pre-trained Language
Models [152.3] 事前訓練されたモデルが大きくなればなるほど、微調整のプロセスは時間がかかり、計算コストがかかる可能性がある。
本稿では,重み更新と最終モデルの重み付けに先立って,疎度を活用することで,資源・パラメータ効率の微調整を行うフレームワークを提案する。
提案するフレームワークは,Dually Sparsity-Embeded Efficient Tuning (DSEE)と呼ばれ,パラメータ効率のよい微調整とリソース効率の推論という2つの重要な目標を達成することを目的としている。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:29:37 GMT)
Delving Deeper into Data Scaling in Masked Image Modeling [145.4] 視覚認識のためのマスク付き画像モデリング(MIM)手法のスケーリング能力に関する実証的研究を行った。
具体的には、Webで収集したCoyo-700Mデータセットを利用する。
我々のゴールは、データとモデルのサイズの異なるスケールでダウンストリームタスクのパフォーマンスがどのように変化するかを調べることです。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:33:46 GMT)
Inverse scaling can become U-shaped [126.6] 言語モデルのスケールアップは、幅広い下流タスクのパフォーマンスを改善するために実証的に示されている。
本稿では,これらの逆スケーリングタスクについて詳しく検討する。
Inverse Scaling Prizeの5倍の計算量でトレーニングされた最大540Bパラメータのモデルを評価する。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:55:50 GMT)
Flan-MoE: Scaling Instruction-Finetuned Language Models with Sparse
Mixture of Experts [125.9] 本稿では,Flan-MoEについて紹介する。
タスク固有のデータセット(言い換えれば命令ファインタニングを含まない)上で自然に微調整されたMoEモデルは、同じ計算複雑性の高密度モデルと比較して、しばしば性能が低下することを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:22:26 GMT)
Enhancing Retrieval-Augmented Large Language Models with Iterative
Retrieval-Generation Synergy [121.5] 検索と生成を反復的に同期させるIter-RetGenと呼ばれる手法により,高い性能が得られることを示す。
モデル出力は、タスクを完了するために必要なものを示し、より関連する知識を取得するための情報的コンテキストを提供する。
Iter-RetGenプロセスは、すべての知識を全体として取得し、構造的な制約なしに生成時の柔軟性をほとんど保持します。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:17:36 GMT)
GlobalBench: A Benchmark for Global Progress in Natural Language
Processing [114.2] GlobalBenchは、すべての言語におけるすべてのNLPデータセットの進捗を追跡することを目的としている。
話者当たりのユーティリティと、全言語にわたるテクノロジのエクイティをトラックする。
現在、GlobalBenchは190言語で966のデータセットをカバーしており、62言語にまたがる1,128のシステムサブミッションを持っている。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:36:32 GMT)
TextDiffuser: Diffusion Models as Text Painters [113.4] 我々は、背景に忠実な視覚的に魅力的なテキストで画像を生成することに焦点を当てたTextDiffuserを紹介した。
我々は,OCRアノテーションを用いた最初の大規模テキスト画像データセットであるMARIO-10Mに,1000万の画像テキストペアをコントリビュートする。
テキストプロンプトのみまたはテキストテンプレート画像と併用して高品質なテキスト画像を作成し,テキストによる不完全な画像の再構成を行う,テキストディフューザは柔軟かつ制御可能であることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:57:19 GMT)
Collaborative World Models: An Online-Offline Transfer RL Approach [112.6] オフライン環境下での視覚的RLの性能を向上させるために,コラボレーティブ・ワールド・モデル(CoWorld)と呼ばれる伝達学習手法を提案する。
実験によると、CoWorldはDeepMind ControlとMeta-Worldのオフライン視覚制御タスクにおいて、既存のメソッドよりも大幅に優れています。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:45:35 GMT)
SODA: Million-scale Dialogue Distillation with Social Commonsense
Contextualization [110.2] SODAは、初めて公開され、数百万スケールの高品質な社会対話データセットである。
我々は、大きな言語モデルから150万の社会的な対話を抽出する。
人間の評価によると、SODAの対話は、従来の人間によるデータセットよりも一貫性があり、特異であり、そして(当然のことながら)自然である。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:45:17 GMT)
Identifying Informational Sources in News Articles [109.7] 我々は、ニュース執筆に使用される情報ソースの、最大かつ最も広範囲にアノテートされたデータセットを構築した。
本稿では,ニュース記事中のソースの構成性を研究するための新しいタスクであるソース予測を導入する。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:56:35 GMT)
LLMDet: A Large Language Models Detection Tool [108.2] LLMDetと呼ばれる,効率的でセキュアでスケーラブルな検出ツールを提案する。
モデルの次の確率の事前情報を利用して、テキストのプロキシパープレキシティを算出する。
次に、プロキシパープレキシティによって測定されたモデルの自己透かし情報を使用して、テキストのソースを検出する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:45:16 GMT)
XTREME-UP: A User-Centric Scarce-Data Benchmark for Under-Represented
Languages [105.5] データ不足は、多言語NLPシステムの開発において重要な問題である。
我々はXTREME-UPを提案する。XTREME-UPはゼロショットではなく、希少なデータシナリオに焦点を当てたベンチマークである。
XTREME-UPは、88言語にまたがる言語モデルが、9つのキーとなるユーザー中心技術上で機能する能力を評価する。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:09:28 GMT)
Understanding Arithmetic Reasoning in Language Models using Causal
Mediation Analysis [104.5] 算術的質問に対する大規模言語モデル(LLM)の機械論的解釈を提案する。
異なる大きさ(2.8Bおよび6Bパラメータ)の事前学習言語モデルの解析を行う。
実験結果から,中間層の小さな集合が算術的質問の予測に大きく影響していることが判明した。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:43:47 GMT)
Domain-Specific Risk Minimization for Out-of-Distribution Generalization [104.2] まず、適応性ギャップを明示的に考慮した一般化境界を確立する。
本稿では,目標に対するより良い仮説の選択を導くための効果的なギャップ推定法を提案する。
もう1つの方法は、オンラインターゲットサンプルを用いてモデルパラメータを適応させることにより、ギャップを最小化することである。
論文参考訳(メタデータ) (Wed, 24 May 2023 01:54:32 GMT)
Self-Evolution Learning for Discriminative Language Model Pretraining [103.6] 自己進化学習(Self-Evolution Learning、SE)は、単純で効果的なトークンマスキングと学習方法である。
SEは情報的だが未探索のトークンを学習することに集中し、新しいToken固有のラベル平滑化アプローチを導入してトレーニングを適応的に調整する。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:00:54 GMT)
Context-Aware Transformer Pre-Training for Answer Sentence Selection [102.7] 本稿では,文脈AS2のダウンストリーム微調整タスクを模倣する3つの事前学習目標を提案する。
実験の結果,事前学習手法により,いくつかのデータセットにおいて,ベースライン文脈AS2精度を最大8%向上できることがわかった。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:10:45 GMT)
Revisiting Token Dropping Strategy in Efficient BERT Pretraining [102.2] トークンドロップは、複数の中間層で入力トークンのサブセットの計算をスキップすることで、BERTのようなマスク付き言語モデルの事前トレーニングを高速化する戦略である。
しかし,トークンのドロップは意味的損失問題を起こしやすく,意味論的タスクの処理に不足していることが実証的に判明した。
そこで本研究では,トークンのドロップを改善するために,シンプルで効果的な意味一貫性学習法(ScTD)を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:59:44 GMT)
SPRING: GPT-4 Out-performs RL Algorithms by Studying Papers and
Reasoning [99.2] 我々は,ゲーム本来の学術論文を読み取るための新しいアプローチ,SPRINGを提案し,大言語モデル(LLM)を通してゲームの説明とプレイの知識を利用する。
実験では,クラフトオープンワールド環境の設定下で,異なる形態のプロンプトによって引き起こされる文脈内「推論」の品質について検討した。
我々の実験は、LLMが一貫したチェーン・オブ・シークレットによって誘導されると、洗練された高レベル軌道の完成に大きな可能性があることを示唆している。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:14:35 GMT)
Learning Answer Generation using Supervision from Automatic Question
Answering Evaluators [98.9] 我々は、自動QA評価モデル(GAVA)の監督を用いたGenQAのための新しいトレーニングパラダイムを提案する。
提案手法を2つの学術的, 1つの産業的データセット上で評価し, 過去の技術状況に対して, 回答精度を大幅に向上させた。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:57:04 GMT)
The Web Can Be Your Oyster for Improving Large Language Models [98.7] 大規模言語モデル(LLM)は、大量の世界の知識を符号化する。
我々はLLMを検索エンジンを用いて大規模ウェブで拡張することを検討する。
ウェブ上に拡張されたLLM UNIWEBを提案する。これは16の知識集約的なタスクに対して、統一されたテキスト・テキスト・フォーマットで訓練される。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:35:39 GMT)
Non-Parametric Learning of Stochastic Differential Equations with Fast
Rates of Convergence [98.4] 非線形微分方程式のドリフトと拡散係数の同定のための新しい非パラメトリック学習パラダイムを提案する。
鍵となる考え方は、基本的には、対応するフォッカー・プランク方程式のRKHSに基づく近似をそのような観測に適合させることである。
論文参考訳(メタデータ) (Wed, 24 May 2023 20:43:47 GMT)
Provable Offline Reinforcement Learning with Human Feedback [95.2] 本研究では,人的フィードバックによるオフライン強化学習の課題について検討する。
提案アルゴリズムは,(1)最大類似度推定(MLE)を用いた暗黙の報酬をオフラインデータから一般関数近似で推定し,(2)MLEの周辺に設定された信頼度に対する分布的に堅牢な計画問題を解く。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:11:26 GMT)
ExpertPrompting: Instructing Large Language Models to be Distinguished
Experts [93.6] ExpertPromptingは、著名な専門家として答えるために、大きな言語モデルの可能性を秘めている。
我々はGPT-3.5を使って新しい命令追跡データを作成し、ExpertLLaMAと呼ばれる競合するオープンソースのチャットアシスタントを訓練する。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:51:31 GMT)
GRILL: Grounded Vision-language Pre-training via Aligning Text and Image
Regions [93.0] 未知のタスクへの一般化は、少数の学習者が多様なタスクにおいてより優れたゼロ/フェーショットのパフォーマンスを達成できる重要な能力である。
GRILLは視覚的質問応答やキャプション,接地タスクなどの多様なタスクに,ほとんど,あるいはごく少数のトレーニングインスタンスで一般化可能な,新しいVLモデルである。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:33:21 GMT)
Solving Diffusion ODEs with Optimal Boundary Conditions for Better Image
Super-Resolution [92.9] 拡散モデルのランダム性は非効率性と不安定性をもたらす。
本稿では,一連の拡散型SR手法の恩恵を受ける可能性を持つプラグアンドプレイサンプリング手法を提案する。
提案手法によりサンプリングされたSR結果の質は, より少ないステップで, 現在の手法でサンプリングした結果の質よりも優れていた。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:09:54 GMT)
Meta-Learning Online Adaptation of Language Models [92.5] 大きな言語モデルは、驚くほど広い世界の知識をパラメータにエンコードする。
静的言語モデルの知識は時代遅れになり、モデルの効果的な「シェルフライフ」が制限される。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:56:20 GMT)
Not All Metrics Are Guilty: Improving NLG Evaluation with LLM
Paraphrasing [92.2] Para-Refは、参照数を増やして評価ベンチマークを強化する新しい方法である。
我々は,大規模言語モデル(LLM)を用いて,単一の参照を多種多様な表現で複数の高品質なものに表現する。
提案手法は, 自動評価値16の相関を+7.82%の比率で効果的に改善することができる。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:53:29 GMT)
Trusting Your Evidence: Hallucinate Less with Context-aware Decoding [91.9] 言語モデル(LM)は入力コンテキストに十分な注意を払うのに苦労し、不信または幻覚を含むテキストを生成する。
本稿では,文脈対応デコード(CAD)を提案する。このデコーディングは,モデルがコンテキストと無コンテキストで使用される場合の確率の差を増幅するコントラスト的な出力分布に従う。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:19:15 GMT)
Semi-Supervised and Long-Tailed Object Detection with CascadeMatch [91.9] そこで我々はCascadeMatchと呼ばれる新しい擬似ラベル型検出器を提案する。
我々の検出器は、プログレッシブな信頼しきい値を持つ多段検出ヘッドを備えたカスケードネットワークアーキテクチャを備えている。
CascadeMatchは、長い尾のオブジェクト検出の処理において、既存の最先端の半教師付きアプローチを超越していることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:09:25 GMT)
Chain-of-Dictionary Prompting Elicits Translation in Large Language
Models [91.6] 大規模言語モデル(LLM)は多言語ニューラルマシン翻訳(MNMT)において驚くほど優れた性能を示した
入力単語のサブセットに対する多言語辞書の連鎖による事前知識でLLMを拡張して翻訳能力を引き出す新しい方法であるCoDを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:01:52 GMT)
Efficient Sampling of Stochastic Differential Equations with Positive
Semi-Definite Models [91.2] 本稿では, ドリフト関数と拡散行列を考慮し, 微分方程式からの効率的なサンプリング問題を扱う。
1/varepsilonは$m2d log (1/varepsilon)$である。
以上の結果から,真の解がより滑らかになるにつれて,どのような凸性も必要とせず,次元の呪いを回避できることが示唆された。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:27:04 GMT)
Perpetual Humanoid Control for Real-time Simulated Avatars [90.6] 本稿では,高忠実度動作模倣と耐故障動作を実現する物理に基づくヒューマノイドコントローラを提案する。
コントローラは、外部の安定化力を使わずに1万本のモーションクリップを学習できる。
実時間およびリアルタイムのマルチパーソンアバター使用事例において,映像ベースのポーズ推定器と言語ベースのモーションジェネレータからノイズのあるポーズを模倣するために,制御器の有効性を実証する。
論文参考訳(メタデータ) (Wed, 24 May 2023 22:05:21 GMT)
3D Open-vocabulary Segmentation with Foundation Models [88.6] 学習済み基礎モデルCLIPとDINOのオープン語彙多様知識とオブジェクト推論能力を活用することで,3次元オープン語彙セグメンテーションの課題に取り組む。
具体的には,CLIPからのオープンボキャブラリ知識とテキスト知識をニューラルラディアンス場(NeRF)に蒸留し,2次元特徴をビュー一貫性の3Dセグメンテーションに効果的に持ち上げる。
我々の手法は、セグメンテーションアノテーションで訓練された完全教師付きモデルよりも優れています。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:18:26 GMT)
Album Storytelling with Iterative Story-aware Captioning and Large
Language Models [86.7] 私たちはアルバムを鮮明で一貫性のあるストーリーに変える方法を研究し、これは「アルバム・ストーリーテリング」と呼ぶタスクである。
近年のLarge Language Models (LLMs) の進歩により、長いコヒーレントなテキストを生成することが可能になった。
本手法は,アルバムのコヒーレンスと鮮明さを向上し,より正確で魅力的なストーリーを効果的に生成する。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:58:03 GMT)
Generalizing Importance Weighting to A Universal Solver for Distribution
Shift Problems [86.5] 分布シフト(DS)は、分布自体が変化し、支持(確率密度がゼロでない集合)も変化する。
既存の手法は (i) と (ii) の場合に有効であるが、 (iii) と (iv) は現在では一般的であるが、まだ探索されていない。
本稿では,すべてのケースにおいて,重み付け(IW)を普遍解法に一般化する。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:53:15 GMT)
Pre-training Multi-party Dialogue Models with Latent Discourse Inference [86.0] 我々は、多人数対話の会話構造、すなわち、各発話が応答する相手を理解するモデルを事前訓練する。
ラベル付きデータを完全に活用するために,談話構造を潜在変数として扱い,それらを共同で推論し,談話認識モデルを事前学習することを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:06:27 GMT)
Evaluating and Inducing Personality in Pre-trained Language Models [85.9] 個性の研究は、個人が思考、感覚、行動においてどのように異なるかに関係している。
既存のLarge Language Models(LLM)は、人間と同じようなパーソナリティを持っているのでしょうか?
論文参考訳(メタデータ) (Wed, 24 May 2023 13:56:04 GMT)
Decoder Tuning: Efficient Language Understanding as Decoding [84.7] 本稿では,タスク固有のデコーダネットワークを出力側で最適化するデコーダチューニング(DecT)を提案する。
勾配ベースの最適化により、DecTは数秒以内にトレーニングでき、サンプル毎に1つのPクエリしか必要としない。
我々は、広範囲にわたる自然言語理解実験を行い、DecTが200ドル以上のスピードアップで最先端のアルゴリズムを大幅に上回っていることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:30:50 GMT)
Lexinvariant Language Models [84.3] 離散語彙記号から連続ベクトルへの写像であるトークン埋め込みは、任意の言語モデル(LM)の中心にある
我々は、語彙記号に不変であり、したがって実際に固定トークン埋め込みを必要としないテクスチトレキシン変種モデルについて研究する。
十分長い文脈を条件として,レキシン変項LMは標準言語モデルに匹敵する難易度が得られることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 19:10:46 GMT)
Reasoning over Hierarchical Question Decomposition Tree for Explainable
Question Answering [83.7] ヘテロジニアス知識統合のための質問分解手法を提案する。
階層的質問分解木(RoHT)を用いた新しい2段階XQAフレームワークを提案する。
複雑なQAデータセットKQA ProとMusiqueの実験は、我々のフレームワークがSOTAメソッドを著しく上回っていることを示している。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:45:59 GMT)
Understanding the Complexity Gains of Single-Task RL with a Curriculum [83.5] 強化学習 (Reinforcement Learning, RL) の問題は, 十分に形が整った報酬なしでは困難である。
カリキュラムで定義されるマルチタスクRL問題として、シングルタスクRL問題を再構成する理論的枠組みを提供する。
マルチタスクRL問題における各タスクの逐次解法は、元の単一タスク問題の解法よりも計算効率がよいことを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 23:51:27 GMT)
Just Ask for Calibration: Strategies for Eliciting Calibrated Confidence
Scores from Language Models Fine-Tuned with Human Feedback [83.3] 答えの信頼性は、答えが正しい可能性を示しているため、低信頼の予測の場合、より高価な専門家に延期することができる。
適切なプロンプト戦略により、RLHF-LMは、モデルの条件付き確率よりもはるかに優れた確率を言語化し、かなりよく校正された予測を可能にする。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:12:33 GMT)
Visual Programming for Text-to-Image Generation and Evaluation [83.1] テキスト・トゥ・イメージ(T2I)生成と評価のための2つの新しい解釈可能・説明可能なビジュアル・プログラミング・フレームワークを提案する。
まず,T2I生成をオブジェクト/カウント生成,レイアウト生成,画像生成という3つのステップに分解する,解釈可能なステップバイステップT2I生成フレームワークであるVPGenを紹介する。
第2に、視覚プログラミングに基づくT2I生成のための解釈可能かつ説明可能な評価フレームワークであるVPEvalを紹介する。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:42:17 GMT)
CoCoMIC: Code Completion By Jointly Modeling In-file and Cross-file
Context [82.9] 予め訓練されたコード LM 上で,ファイル内コンテキストとファイル内コンテキストを協調的に学習するための,クロスファイルコンテキストを組み込んだフレームワークを提案する。
CoCoMICは既存のコードLMを33.94%の精度で改善し、クロスファイルコンテキストが提供されるとコード補完のための識別子マッチングが28.69%増加した。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:56:45 GMT)
Focus Your Attention (with Adaptive IIR Filters) [82.7] 本稿では2次インパルス応答(IIR)フィルタを用いて入力シーケンスを動的に処理する新しい層を提案する。
比較的低次であるにもかかわらず、因果適応フィルタは関連する配列要素に注目することが示されている。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:42:30 GMT)
Clever Hans or Neural Theory of Mind? Stress Testing Social Reasoning in
Large Language Models [82.5] 多くの逸話例は、ChatGPTやGPT-4のような新しい大規模言語モデル(LLM)が、N-ToM(Neural Theory-of-Mind)を示すことを示唆するために使用された。
我々は,LLMsのN-ToMの範囲を6つのタスクに対して広範囲に評価することにより検討し,LLMsが特定のN-ToM能力を示す一方で,この挙動は堅牢性には程遠いことを見出した。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:14:31 GMT)
A Tale of Two Features: Stable Diffusion Complements DINO for Zero-Shot
Semantic Correspondence [82.3] 我々は,意味的および密接な対応のために安定拡散機能を利用する。
単純な後処理により、SD機能はSOTA表現と定量的に類似させることができる。
これらの対応は,2つの画像のインスタンススワップなど,興味深い応用を可能にすることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:59:26 GMT)
BUFFET: Benchmarking Large Language Models for Few-shot Cross-lingual
Transfer [81.6] 本稿では,54言語にまたがる15のタスクをシーケンス・ツー・シーケンス・フォーマットで統一するBUFFETを紹介する。
BUFFETは、数発の言語間移動のための厳密で公平な評価フレームワークを確立するように設計されている。
コンテクスト内言語間移動における改善の余地は極めて大きいことが判明した。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:06:33 GMT)
Audio-Visual Dataset and Method for Anomaly Detection in Traffic Videos [81.1] そこで本研究では,MAVADと呼ばれる実世界のシーンから得られたトラフィック異常検出のための最初の音声視覚データセットについて紹介する。
本稿では,映像系列から抽出した視覚的特徴と音声的特徴をクロスアテンションを用いて組み合わせ,異常を検出するAVACAという手法を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:02:42 GMT)
Cheap and Quick: Efficient Vision-Language Instruction Tuning for Large
Language Models [80.3] 大規模言語モデル(LLM)の有効なVL適応のための,新規で安価なソリューションを提案する。
画像エンコーダとLLMを接続するために大きなニューラルネットワークを使用する代わりに、MMAは軽量モジュール、すなわちアダプタを採用する。
MMAはまた、LLMがシングルモードとマルチモードの命令を自動シフトするのを助けるルーティングアルゴリズムも備えている。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:06:15 GMT)
ChatCoT: Tool-Augmented Chain-of-Thought Reasoning on Chat-based Large
Language Models [79.5] ChatCoTはチャットベースのLLMのためのツール拡張チェーン推論フレームワークである。
各ターンで、LSMはツールと対話するか、推論を実行することができる。
本手法は,チャット型LLMのマルチターン会話能力を効果的に活用する。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:40:59 GMT)
LayoutGPT: Compositional Visual Planning and Generation with Large
Language Models [79.3] 大規模言語モデル(LLM)は、テキスト条件からレイアウトを生成することで視覚的なプランナーとして機能する。
本稿では,スタイルシート言語におけるコンテキスト内視覚的デモンストレーションを構成する手法であるLayoutGPTを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:56:16 GMT)
Refocusing Is Key to Transfer Learning [77.8] Top-Down Attention Steering (TOAST)は、タスク固有の機能に注意を向ける転送学習アルゴリズムである。
様々な細かい視覚分類データセットのパフォーマンスを大幅に改善する。
論文参考訳(メタデータ) (Wed, 24 May 2023 20:03:04 GMT)
IdealGPT: Iteratively Decomposing Vision and Language Reasoning via
Large Language Models [77.1] 大規模言語モデル(LLM)を用いた視覚・言語推論(VL)を分解するフレームワークを開発する。
特に、IdealGPTは、VCRでは10%、SNLI-VEでは15%、既存のGPT-4のようなモデルよりも優れています。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:19:57 GMT)
Weakly Supervised Vision-and-Language Pre-training with Relative
Representations [76.6] 弱教師付き視覚・言語事前学習は、事前学習のデータコストを効果的に削減することを示した。
現在の手法では、イメージのローカル記述(オブジェクトタグ)のみをクロスモーダルアンカーとして使用し、事前トレーニングのための弱い整列されたイメージテキストペアを構築する。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:10:24 GMT)
Operationalizing Counterfactual Metrics: Incentives, Ranking, and
Information Asymmetry [76.0] このような平均的な治療結果の指標から生じるインセンティブのずれについて検討する。
これらの結果から, 治療選択を推進しているインセンティブは, 治療結果が不十分であった場合の患者福祉の最大化と一致していることが示唆された。
論文参考訳(メタデータ) (Wed, 24 May 2023 00:24:38 GMT)
Large Language Models are In-Context Semantic Reasoners rather than
Symbolic Reasoners [75.9] 大規模言語モデル(LLM)は、近年、自然言語と機械学習コミュニティを興奮させています。
多くの成功を収めたアプリケーションにもかかわらず、そのようなコンテキスト内機能の基盤となるメカニズムはまだ不明である。
本研究では,学習した言語トークンのテクストセマンティクスが推論過程において最も重い処理を行うと仮定する。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:33:34 GMT)
Adapting Language Models to Compress Contexts [75.8] トランスフォーマーベースの言語モデル(LM)は強力で広く適用可能なツールであるが、その有用性は有限コンテキストウィンドウによって制限される。
本稿では,事前学習したLMを,長いコンテキストをコンパクトな要約ベクトルに圧縮可能なAutoCompressorに適応させることを提案する。
我々は最大30,720個のトークンのシーケンスでOPTモデルを微調整し、AutoCompressorが長いコンテキストを使ってパープレキシティを向上できることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:42:44 GMT)
Learning Reward Machines in Cooperative Multi-Agent Tasks [75.8] 本稿では,MARL(Multi-Agent Reinforcement Learning)に対する新しいアプローチを提案する。
これは、協調的なタスク分解と、サブタスクの構造をコードする報酬機(RM)の学習を組み合わせる。
提案手法は、部分的に観測可能な環境下での報酬の非マルコフ的性質に対処するのに役立つ。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:20:20 GMT)
Biological Sequence Design with GFlowNets [75.2] 望ましい性質を持つデノボ生物配列の設計には、数ラウンドの分子のアイデアと高価なウェットラブ評価を伴う活性ループが伴うことが多い。
これにより、提案された候補の多様性は、構想段階において重要な考慮事項となる。
本稿では,不確実性推定と近年提案されているGFlowNetを多種多様な候補解の生成元として活用した能動的学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:21:54 GMT)
Data-Efficient Finetuning Using Cross-Task Nearest Neighbors [75.1] 我々は、ラベル付きターゲットタスクの例を用いて、プロンプトを付加したマルチタスクデータのプールから、最も類似したラベル付きサンプルを検索する。
マルチタスク近傍におけるファインタニングモデルのアプローチは,データ効率が著しく向上する。
論文参考訳(メタデータ) (Wed, 24 May 2023 22:27:47 GMT)
One-stop Training of Multiple Capacity Models [74.9] 本稿では,高容量・低容量モデルとの共同学習のためのワンストップトレーニングフレームワークを提案する。
複数のキャパシティモデルをスクラッチから個別に訓練する知識蒸留とは異なり、我々の手法は異なるキャパシティモデルからの監督を同時に統合する。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:37:47 GMT)
BLIP-Diffusion: Pre-trained Subject Representation for Controllable
Text-to-Image Generation and Editing [73.7] BLIP-Diffusionはマルチモーダル制御をサポートする新しい主観駆動画像生成モデルである。
他の主観駆動生成モデルとは異なり、BLIP-Diffusionは主観表現を提供するために事前訓練された新しいマルチモーダルエンコーダを導入する。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:51:04 GMT)
Decomposing Complex Queries for Tip-of-the-tongue Retrieval [72.1] 複雑なクエリは、コンテンツ要素(例えば、書籍の文字やイベント)、ドキュメントテキスト以外の情報を記述する。
この検索設定は舌の先端 (TOT) と呼ばれ、クエリと文書テキスト間の語彙的および意味的重複に依存するモデルでは特に困難である。
クエリを個別のヒントに分解し、サブクエリとしてルーティングし、特定の検索者にルーティングし、結果をアンサンブルすることで、このような複雑なクエリを扱うための、シンプルで効果的なフレームワークを導入します。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:43:40 GMT)
Bias-to-Text: Debiasing Unknown Visual Biases through Language
Interpretation [72.0] 本稿では,視覚モデルにおけるバイアスを識別・緩和するB2Tフレームワークを提案する。
視覚バイアスの言語記述は、新しいバイアスの発見と効果的なモデルバイアスの発見を可能にする説明可能な形式を提供する。
様々な画像分類・生成タスクにおけるフレームワークの有効性を実証する。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:06:31 GMT)
Uncovering and Quantifying Social Biases in Code Generation [72.0] コード生成モデルにおいて,コードプロンプトを構築し,社会的バイアスを明らかにするための新しいパラダイムを提案する。
我々は,3つの指標とともにデータセットを開発し,社会の偏見と,異なる人口層間でのきめ細かい不公平さを評価する。
我々は、社会的バイアスの低いコード生成モデルをさらに選択するための有用な洞察を提供するために分析を行う。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:37:33 GMT)
Text encoders are performance bottlenecks in contrastive vision-language
models [71.2] 単一ベクトルのテキスト表現からキャプションを再構築することを目的としたテキストのみのリカバリプローブを訓練する。
CLIPのテキストエンコーダは、オブジェクトの関係、属性オブジェクトの関連、カウント、否定に不足している。
その結果、コントラッシブ・ビジョン+言語モデルにおける構成因子をモデル化するために、テキストのみの回復性は必要である(しかし十分ではない)ことが示唆された。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:48:44 GMT)
Barkour: Benchmarking Animal-level Agility with Quadruped Robots [71.0] 脚付きロボットのアジリティを定量化するための障害物コースであるBarkourベンチマークを導入する。
犬の機敏性の競争に触発され、様々な障害と時間に基づくスコアリング機構から構成される。
ベンチマークに対処する2つの方法を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:49:43 GMT)
TAN Without a Burn: Scaling Laws of DP-SGD [70.7] 近年、ディープニューラルネットワーク(DNN)を訓練するための微分プライベートな手法が進歩している。
プライバシ分析とノイズのあるトレーニングの実験的振る舞いを分離し、最小限の計算要件でトレードオフを探索する。
我々は,提案手法をCIFAR-10とImageNetに適用し,特にImageNetの最先端性を,上位1点の精度で向上させる。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:20:05 GMT)
Machine Reading Comprehension using Case-based Reasoning [70.5] 本稿では,機械読解における解答抽出の正確かつ解釈可能な手法を提案する。
本手法は,類似した質問に対する文脈的回答が相互に意味的類似性を共有するという仮説に基づいている。
我々は,CBR-MRCが大規模リーダモデルに匹敵する高いテスト精度を実現することを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:09:56 GMT)
Dior-CVAE: Diffusion Priors in Variational Dialog Generation [70.4] 条件変分オートエンコーダ(CVAE)は近年,多様な応答生成に用いられている。
本稿では,拡散モデルによる情報伝達を前提とした階層型CVAEモデルであるDior-CVAEを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:06:52 GMT)
Learning the String Partial Order [70.4] 入力文字列中のトークンの部分順序付けとして,ほとんどの構造化された予測問題を線形時間と空間で解くことができることを示す。
提案手法は,入力文字列中の各トークンの実際の数値を計算し,それに応じてトークンをソートし,文字列内のトークンの総順序を2つに抑える。
実験の結果,本手法は合計2桁,95.7 LASと97.1 UASの交叉を用いて95.4 LASと96.9 UASを達成することがわかった。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:47:35 GMT)
Sentiment Analysis in the Era of Large Language Models: A Reality Check [70.0] 本稿では,大規模言語モデル(LLM)の様々な感情分析タスクの実行能力について検討する。
26のデータセット上の13のタスクのパフォーマンスを評価し、ドメイン固有のデータセットに基づいて訓練された小言語モデル(SLM)と比較した。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:45:25 GMT)
T1: Scaling Diffusion Probabilistic Fields to High-Resolution on Unified
Visual Modalities [69.2] 拡散確率場(DPF)は、距離空間上で定義された連続関数の分布をモデル化する。
本稿では,局所構造学習に着目したビューワイズサンプリングアルゴリズムによる新しいモデルを提案する。
モデルは、複数のモダリティを統一しながら、高解像度のデータを生成するためにスケールすることができる。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:32:03 GMT)
What Are You Token About? Dense Retrieval as Distributions Over the
Vocabulary [68.8] 本稿では,2つのエンコーダが生成するベクトル表現を,モデルの語彙空間に投影することで解釈する。
得られたプロジェクションは、リッチな意味情報を含み、それらの間の接続を描画し、スパース検索を行う。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:05:27 GMT)
Contrastive Training of Complex-Valued Autoencoders for Object Discovery [68.5] アーキテクチャの変更と、最先端の同期モデルを大幅に改善する新しいコントラスト学習手法を導入する。
マルチオブジェクトカラーデータセットにおいて、教師なしの方法でオブジェクトを発見できる同期ベースモデルのクラスを初めて取得する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:37:43 GMT)
Advancing Topic Segmentation and Outline Generation in Chinese Texts:
The Paragraph-level Topic Representation, Corpus, and Benchmark [68.4] タイトル,サブヘッダ,段落を含む階層的な段落レベルのトピック構造表現を導入する。
我々は,これまでで最大であった4倍の大きさの中国段落レベルのトピック構造コーパス(CPTS)を構築した。
我々は,2つの基本課題(トピックセグメンテーションとアウトライン生成)におけるCPTSの計算可能性について,いくつかの強いベースラインで検証し,その有効性は下流タスクにおいて予め確認されている:談話解析である。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:43:23 GMT)
Regret Matching+: (In)Stability and Fast Convergence in Games [68.1] RM+とその予測バージョンは不安定であり,他のプレイヤーが大きな後悔を味わう可能性がある。
これらの修正は、RM+による通常のゲームにおいて、個々の後悔に対して$O(T1/4)$$と$O(1)$の社会的後悔を得るのに十分であることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:26:21 GMT)
Hierarchical clustering with dot products recovers hidden tree structure [68.0] 本稿では,階層構造の回復に着目した凝集クラスタリングアルゴリズムの新しい視点を提案する。
クラスタを最大平均点積でマージし、例えば最小距離やクラスタ内分散でマージしないような、標準的なアルゴリズムの単純な変種を推奨する。
このアルゴリズムにより得られた木は、汎用確率的グラフィカルモデルの下で、データ中の生成的階層構造をボナフェイド推定することを示した。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:05:12 GMT)
HuatuoGPT, towards Taming Language Model to Be a Doctor [68.0] HuatuoGPTは医療相談のための大規模言語モデル(LLM)である。
我々は,ChatGPTのテクティット蒸留データと,教師付き微調整段階の医師のテクティトゥルワールドデータの両方を活用する。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:56:01 GMT)
Towards More Suitable Personalization in Federated Learning via
Decentralized Partial Model Training [67.7] 既存のシステムのほとんどは、中央のFLサーバが失敗した場合、大きな通信負荷に直面しなければならない。
共有パラメータと個人パラメータを交互に更新することで、ディープモデルの「右」をパーソナライズする。
共有パラメータアグリゲーションプロセスをさらに促進するために、ローカルシャープネス最小化を統合するDFedを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:52:18 GMT)
AlignSTS: Speech-to-Singing Conversion via Cross-Modal Alignment [67.1] STS音声変換タスクは,音声録音に対応する歌唱サンプルを生成することを目的としている。
本稿では,明示的なクロスモーダルアライメントに基づくSTSモデルであるAlignSTSを提案する。
実験の結果、AlignSTSは客観的メトリクスと主観的メトリクスの両方で優れたパフォーマンスを達成している。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:37:42 GMT)
NuScenes-QA: A Multi-modal Visual Question Answering Benchmark for
Autonomous Driving Scenario [66.3] NuScenesQAは、自動運転シナリオにおけるVQAの最初のベンチマークであり、34Kの視覚シーンと460Kの質問応答ペアを含んでいる。
既存の3D検出アノテーションを利用してシーングラフと質問テンプレートを手動で作成する。
先進的な3D検出とVQA技術を用いた一連のベースラインを開発する。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:40:50 GMT)
Learning Large-scale Neural Fields via Context Pruned Meta-Learning [65.0] 本稿では,大規模ニューラルネットワーク学習のための最適化に基づくメタラーニング手法を提案する。
メタテスト時間における勾配再スケーリングは、非常に高品質なニューラルネットワークの学習を可能にすることを示す。
我々のフレームワークは、モデルに依存しない、直感的で、実装が容易であり、幅広い信号に対する大幅な再構成改善を示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:05:13 GMT)
Augmentation-Aware Self-Supervision for Data-Efficient GAN Training [64.9] 識別器が過度に適合する傾向があるため, 限られたデータでGANを訓練することは困難である。
本稿では,拡張データの拡張パラメータを予測する,拡張型自己教師型識別器を提案する。
実験の結果,データ効率向上のためのSOTA法よりも優れた手法が得られた。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:43:58 GMT)
Interpretable by Design Visual Question Answering [64.7] 解釈可能なVQAモデルは、画像のどの部分から得られる結論を判断できるべきだ、と我々は主張する。
ここでは、VQA問題に対する明示的な中間的動的推論構造を設計する。
InterVQAは、最先端(ソータ)のエンドタスクのパフォーマンスと同様に、高品質な明示的な中間推論ステップを生成する。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:33:15 GMT)
In-Context Demonstration Selection with Cross Entropy Difference [64.2] 大規模言語モデル(LLM)は、ゼロショットタスクのパフォーマンスを改善するためにコンテキスト内デモを使用することができる。
テキスト内デモを選択するためのクロスエントロピー差分法(CED)を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:04:00 GMT)
Instruct2Act: Mapping Multi-modality Instructions to Robotic Actions
with Large Language Model [63.7] Instruct2Actは、ロボット操作タスクのシーケンシャルアクションにマルチモーダル命令をマッピングするフレームワークである。
我々のアプローチは、様々な命令のモダリティや入力タイプを調節する上で、調整可能で柔軟なものである。
我々のゼロショット法は、いくつかのタスクにおいて、最先端の学習ベースのポリシーよりも優れていた。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:17:34 GMT)
PropSegmEnt: A Large-Scale Corpus for Proposition-Level Segmentation and
Entailment Recognition [63.5] 文中の各命題の文的含意関係を個別に認識する必要性について論じる。
提案するPropSegmEntは45K以上の提案のコーパスであり, 専門家によるアノテートを行う。
我々のデータセット構造は、(1)文書内の文章を命題の集合に分割し、(2)異なるが、トポジカルに整合した文書に対して、各命題の含意関係を分類するタスクに類似している。
論文参考訳(メタデータ) (Wed, 24 May 2023 23:19:14 GMT)
OD-NeRF: Efficient Training of On-the-Fly Dynamic Neural Radiance Fields [63.0] ダイナミック・ニューラル・レイディアンス・フィールド(ダイナミック・ニューラル・レイディアンス・フィールド)は、3次元ダイナミック・シーンにおける新しいビュー・シンセサイザーにおいて印象的な結果を示した。
本研究では,ダイナミックシーンのストリーミングが可能な動的NeRFを効率よく訓練・レンダリングするOD-NeRFを提案する。
本アルゴリズムは,6FPSトレーニングと合成動的シーンのレンダリングのインタラクティブな高速化を実現し,実世界の動的シーンの最先端と比較して,大幅なスピードアップを実現している。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:36:47 GMT)
Beyond Invariance: Test-Time Label-Shift Adaptation for Distributions
with "Spurious" Correlations [63.0] テスト時のデータ分散の変化は、予測モデルのパフォーマンスに有害な影響を及ぼす可能性がある。
本研究では,未ラベルサンプルに適用したEMを用いて,共同分布の$p(y, z)$の変化に適応するテストタイムラベルシフト補正を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:58:00 GMT)
Using Natural Language Explanations to Rescale Human Judgments [62.7] 一般的な実践は、複数のクラウドワーカーの判断に対してコンセンサスアノテーションを通じてデータをラベル付けすることである。
これらのニュアンスを,高品質な自然言語による説明によって捉えることができることを示す。
本稿では,不一致の有無で順序付けアノテーションを再スケールする手法を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:19:14 GMT)
EmbodiedGPT: Vision-Language Pre-Training via Embodied Chain of Thought [62.4] Embodied AIは、ロボットが物理的な環境で長時間のタスクを遂行するためのアクションシーケンスを計画し、実行することができる。
本稿では,EmbodiedGPTを紹介する。EmbodiedGPTは,エンボディドAIのためのエンドツーエンドのマルチモーダル基盤モデルである。
実験は、実施計画、実施制御、視覚的キャプション、視覚的質問応答など、実施されたタスクに対するEmbodiedGPTの有効性を示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:04:30 GMT)
Mixture of Prompt Experts for Generalizable and Interpretable Question
Answering [61.6] 我々は,複数の特殊なLLMをアンサンブルするMOPEシステムを提案する。
各質問に対して最適な特化モデルを戦略的に選択することにより、MOPEシステムは、12のQAデータセットのコレクション上で、どの特化モデルよりも大幅に優れています。
我々の人間による研究は、専門家による予測と回答の選択プロセスの提示が、アノテータがシステムの出力をいつ信頼するかをより正確に決定するのに役立つことを確認している。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:00:51 GMT)
MultiTabQA: Generating Tabular Answers for Multi-Table Question
Answering [61.5] 実世界のクエリは本質的に複雑で、リレーショナルデータベースやWebページ内の複数のテーブルにまたがることが多い。
我々のモデルであるMultiTabQAは、複数のテーブル上の質問に答えるだけでなく、表形式の回答を生成するために一般化する。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:13:47 GMT)
Getting Sick After Seeing a Doctor? Diagnosing and Mitigating Knowledge
Conflicts in Event Temporal Reasoning [61.5] イベント時間的推論は、2つ以上のイベント間の時間的関係を特定することを目的としている。
知識の衝突は、コンテキスト内の事象の実際の時間的関係と、モデルによって学習された事前の知識やバイアスとの間にミスマッチがあるときに起こる。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:04:06 GMT)
Nerfstudio: A Modular Framework for Neural Radiance Field Development [61.1] NerfstudioはNeural Radiance Fields(NeRF)メソッドを実装するためのモジュール型のPyTorchフレームワークである。
NeRFはコンピュータビジョン、グラフィックス、ロボティクスなどの幅広い応用分野において急速に成長している研究分野である。
我々のフレームワークにはNeRFベースの手法を実装するためのプラグイン・アンド・プレイコンポーネントが含まれており、研究者や実践者が彼らのプロジェクトにNeRFを組み込むのが容易になる。
論文参考訳(メタデータ) (Wed, 24 May 2023 00:29:19 GMT)
Theoretically Principled Federated Learning for Balancing Privacy and
Utility [61.0] モデルパラメータを歪ませることでプライバシを保護する保護機構の一般学習フレームワークを提案する。
フェデレートされた学習における各コミュニケーションラウンドにおいて、各クライアント上の各モデルパラメータに対して、パーソナライズされたユーティリティプライバシトレードオフを実現することができる。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:44:02 GMT)
RefGPT: Reference -> Truthful & Customized Dialogues Generation by GPTs
and for GPTs [60.1] ChatGPTのような一般的なチャットモデルは、高品質な命令データでLLM(Large Language Models)をチューニングすることで、幅広いNLPタスクを解決するための印象的な能力を得た。
しかし、人間による高品質なデータ収集、特にマルチターン対話は高価であり、ほとんどの人にとっては実現不可能である。
本稿では,モデル幻覚による事実の誤りを気にすることなく,膨大な真実とカスタマイズされた対話を生成するためのRefGPTを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:30:42 GMT)
Deep Stochastic Processes via Functional Markov Transition Operators [59.6] 本稿では,ニューラルパラメータ化マルコフ遷移作用素の列を関数空間に重ねて構築した新しいプロセス群(SP)を紹介する。
これらのマルコフ遷移作用素は、SPの交換可能性と整合性を維持することができることを証明している。
論文参考訳(メタデータ) (Wed, 24 May 2023 21:15:23 GMT)
Reconfigurable Distributed FPGA Cluster Design for Deep Learning
Accelerators [59.1] エッジコンピューティングアプリケーション用に設計された低消費電力組み込みFPGAに基づく分散システムを提案する。
提案システムは,様々なニューラルネットワーク(NN)モデルを同時に実行し,パイプライン構造にグラフを配置し,NNグラフの最も計算集約的な層により大きなリソースを手動で割り当てる。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:08:55 GMT)
MQuAKE: Assessing Knowledge Editing in Language Models via Multi-Hop
Questions [59.0] MQuAKE (Multi-hop Question Answering for Knowledge Editing)を提案する。
本稿では,メモリベースのアプローチであるMeLLoを提案する。これは,編集された事実に整合した回答を生成するために,言語モデルを反復的に促しながら,すべての編集された事実を外部に保存する。
我々は,MLLoがLLM(最大175B)とうまく対応し,従来のモデルエディタよりも大きなマージンで優れていることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:48:41 GMT)
Gender Biases in Automatic Evaluation Metrics: A Case Study on Image
Captioning [58.9] 我々は,イメージキャプションタスクに着目し,モデルに基づく評価指標の性別バイアスに関する体系的研究を行った。
まず、職業、活動、対象概念に関するさまざまな評価指標において、性別バイアスを識別し、定量化する。
我々は、これらのバイアス付きメトリクスを使用することによるネガティブな結果を示し、例えば、デプロイメントにおいてバイアス付き生成モデルを支持する。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:27:40 GMT)
Near-Minimax-Optimal Risk-Sensitive Reinforcement Learning with CVaR [58.4] 本研究は,リスク許容度が$tau$のCVaR(Conditional Value at Risk)の目的に着目し,リスクに敏感な強化学習(RL)について検討する。
ミニマックスCVaRの後悔率は$Omega(sqrttau-1AK)$で、$A$はアクションの数、$K$はエピソード数である。
我々は,このアルゴリズムが連続性仮定の下で$widetilde O(tau-1sqrtSAK)$の最適後悔を達成し,一般に近似することを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 21:47:10 GMT)
Bridging Continuous and Discrete Spaces: Interpretable Sentence
Representation Learning via Compositional Operations [58.0] 文の合成意味論が埋め込み空間における構成操作として直接反映できるかどうかは不明である。
文埋め込み学習のためのエンドツーエンドフレームワークであるInterSentを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 00:44:49 GMT)
BeamSearchQA: Large Language Models are Strong Zero-Shot QA Solver [58.0] 我々はeamSearchQAと呼ばれる新しい問合せパイプラインを提案する。
提案手法では, 大規模言語モデルを用いて, 元の質問に対する質問を反復的に生成する。
我々は、広く使われているオープンドメインNQおよびWebQデータセットに対するアプローチを評価した。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:16:44 GMT)
Discriminator-Guided Multi-step Reasoning with Language Models [56.5] 修正Essディスクリミネータ(GRACE)を用いた誘導多段階推論について紹介する。
GRACEは、正しい推論ステップを生成するためのモデルを段階的にデコードするアプローチである。
従来の復号法と比較すると、GRACEは最終的な解答精度とステップの正解性の両方において大幅に改善されている。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:16:51 GMT)
MRN: Multiplexed Routing Network for Incremental Multilingual Text
Recognition [56.4] インクリメンタル・ラーニング・セッティングにおいて,インクリメンタル・マルチ言語テキスト認識タスクを導入する。
本稿では,各言語に対して一連の認識器を訓練するMultiplexed Routing Network (MRN)を提案する。
MRNは、古いデータへの依存を効果的に減らし、リハーサル不均衡に適している。
MLT17 と MLT19 のデータセット上で MRN を広範囲に評価し,既存の最先端手法よりも大きなマージンで性能を向上した。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:03:34 GMT)
Few-Shot Meta Learning for Recognizing Facial Phenotypes of Genetic
Disorders [55.4] 分類の自動化と類似性検索は、医師が可能な限り早期に遺伝状態の診断を行うための意思決定を支援する。
従来の研究は分類問題としてこの問題に対処し、深層学習法を用いてきた。
本研究では,健常人の大規模なコーパスで訓練した顔認識モデルを用いて,顔の表情認識に移行した。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:37:42 GMT)
Deceptive-NeRF: Enhancing NeRF Reconstruction using Pseudo-Observations
from Diffusion Models [55.0] Deceptive-NeRFは、合成擬似観測を用いて再構成されたNeRFモデルの品質を向上させる新しい方法である。
提案手法は, 粗いNeRFモデルを粗い入力から再構成する, 2) 粗いモデルに基づいて擬似観測を生成する,3) 擬似観測を用いて改良して高品質な再構成を行う,という3つの重要なステップを含む。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:00:32 GMT)
State of the Art and Potentialities of Graph-level Learning [54.7] グラフレベルの学習は、比較、回帰、分類など、多くのタスクに適用されている。
グラフの集合を学習する伝統的なアプローチは、サブストラクチャのような手作りの特徴に依存している。
ディープラーニングは、機能を自動的に抽出し、グラフを低次元表現に符号化することで、グラフレベルの学習をグラフの規模に適応させるのに役立っている。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:41:51 GMT)
Model evaluation for extreme risks [54.5] AI開発のさらなる進歩は、攻撃的なサイバー能力や強力な操作スキルのような極端なリスクを引き起こす能力につながる可能性がある。
モデル評価が極端なリスクに対処するために重要である理由を説明します。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:38:43 GMT)
Visually-Aware Audio Captioning With Adaptive Audio-Visual Attention [54.4] 曖昧な音を正確に認識する方法は、音声キャプションにとって大きな課題である。
本稿では,視覚情報を利用して不明瞭な音の物体の記述を支援する視覚認識型音声キャプションを提案する。
提案手法は,機械翻訳メトリクスの最先端結果を実現する。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:59:04 GMT)
Hierarchical Integration Diffusion Model for Realistic Image Deblurring [54.4] 拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。
本稿では,階層型統合拡散モデル(HI-Diff)を提案する。
人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:32:53 GMT)
Dealing with Cross-Task Class Discrimination in Online Continual
Learning [54.3] 本稿では,クラスインクリメンタルラーニング(CIL)における新たな課題について論じる。
新しいタスクのクラスと古いタスクの間の決定境界を、古いタスクデータへの(あるいは制限された)アクセスなしで設定する方法。
リプレイ方式では、前のタスクから少量のデータ(再生データ)を節約する。現在のタスクデータのバッチが到着すると、システムは、新しいデータとサンプルデータとを共同でトレーニングする。
本稿では,リプレイ手法には動的トレーニングバイアスの問題があり,CTCD問題の解法におけるリプレイデータの有効性を低下させる。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:52:30 GMT)
ForkMerge: Mitigating Negative Transfer in Auxiliary-Task Learning [54.2] 補助タスク学習(ATL)は、関連するタスクから得られる知識を活用することにより、目標タスクの性能を向上させることを目的としている。
複数のタスクを同時に学習すると、ターゲットタスクのみを学習するよりも精度が低下することがある。
ForkMergeは、モデルを定期的に複数のブランチにフォークし、タスクの重みを自動的に検索する新しいアプローチである。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:08:50 GMT)
PIVOINE: Instruction Tuning for Open-world Information Extraction [54.0] 構造化されていないテキストから包括的エンティティプロファイルを抽出するオープンワールド情報抽出(オープンワールドIE)の問題を考える。
我々は,オープンワールドIEを動作させ,自然言語命令を特徴とする目的のエンティティプロファイルを抽出できる大規模言語モデル(LLM)を開発した。
特にINSTRUCTOPENWIKIは,包括的コーパス,豊富なアノテーション,多種多様な命令を満載したオープンワールドIE向け指導チューニングデータセットである。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:52:08 GMT)
SSD-2: Scaling and Inference-time Fusion of Diffusion Language Models [53.3] 拡散に基づく言語モデル(LM)は推論で容易に制御できる有能な生成モデルであることが示されている。
本稿では,最近提案した拡散モデルSSD-LMを0.4Bから13Bパラメータに拡張する手法を提案する。
自己回帰モデルと比較して、拡散モデル間の協調はより効果的であり、より高い品質とより関連するモデル応答をもたらす。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:22:14 GMT)
Text-Augmented Open Knowledge Graph Completion via Pre-Trained Language
Models [53.1] 本稿では,高品質なクエリプロンプトを自動的に生成し,大規模テキストコーパスからサポート情報を取得するためのTAGREALを提案する。
その結果、TAGREALは2つのベンチマークデータセット上で最先端のパフォーマンスを達成することがわかった。
TAGREALは、限られたトレーニングデータであっても、既存の埋め込みベース、グラフベース、およびPLMベースの手法よりも優れた性能を有することが判明した。
論文参考訳(メタデータ) (Wed, 24 May 2023 22:09:35 GMT)
Balancing the Picture: Debiasing Vision-Language Datasets with Synthetic
Contrast Sets [52.8] 視覚言語モデルは、インターネットから未計算の画像テキストペアの事前トレーニング中に学んだ社会的バイアスを永続し、増幅することができる。
COCO Captionsは、背景コンテキストとその場にいる人々の性別間のバイアスを評価するために最も一般的に使用されるデータセットである。
本研究では,COCOデータセットを男女バランスの取れたコントラストセットで拡張する新しいデータセットデバイアスパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:59:18 GMT)
L-CAD: Language-based Colorization with Any-level Descriptions [51.8] 我々は,任意のレベルの記述で言語ベースの色付けを行う統一モデルを提案する。
我々は、その頑健な言語理解と豊かな色優先のために、事前訓練されたモダリティ生成モデルを活用する。
提案した新しいサンプリング戦略により,多様な複雑なシナリオにおいて,インスタンス認識のカラー化を実現する。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:57:42 GMT)
ChatGPT and Simple Linguistic Inferences: Blind Spots and Blinds [51.2] 本稿では,人間にとって容易な単純な推論タスクに焦点をあてる。
我々は, (i) 文法的に特定された含意, (ii) 不確実性のある明らかな副詞を持つ前提, (iii) 単調性含意を目標とする。
以上の結果から,モデルがこのような推論に苦慮し,中程度の精度で精度が低いことが示唆された。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:41:09 GMT)
Learning Structured Components: Towards Modular and Interpretable
Multivariate Time Series Forecasting [51.2] 時空間パターンの各コンポーネントを個別にモデル化するモジュラーで解釈可能なフレームワークを開発した。
SCNNは、空間時間パターンの潜在構造を算術的に特徴づける、MSSの事前定義された生成プロセスで動作する。
SCNNが3つの実世界のデータセットの最先端モデルよりも優れた性能を達成できることを示す実験を行った。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:13:40 GMT)
Coverage-based Example Selection for In-Context Learning [51.1] インコンテキスト学習(ICL)では、テストインスタンスについて情報を提供するデモが必要である。
最も類似した例を独立に選択する標準的なアプローチは、冗長なデモを選択する。
本研究は, 実感的側面を包括的に把握し, 実感性を評価するための枠組みを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:58:28 GMT)
SenteCon: Leveraging Lexicons to Learn Human-Interpretable Language
Representations [51.1] SenteConは、深層言語表現に人間の解釈可能性を導入する方法である。
SenteConは、下流タスクにおける予測性能にほとんど、あるいは全くコストをかからない高レベルな解釈性を提供する。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:06:28 GMT)
Eliciting the Translation Ability of Large Language Models via
Multilingual Finetuning with Translation Instructions [51.0] ChatGPTやGPT4のような大規模事前学習言語モデルは、多言語翻訳において強力な能力を示している。
与えられた指示に従って多言語翻訳を行うために,多言語事前学習言語モデルであるXGLM-7Bを微調整して詳細な解析を行う。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:00:24 GMT)
Meta-review Generation with Checklist-guided Iterative Introspection [50.6] 本稿では,論文レビューをメタレビューに合成する,科学的意見要約の課題を提案する。
39のカンファレンスから10,989のペーパーメタレビューと40,903のペーパーレビューをカバーする新しいORSUMデータセットを紹介した。
結論として,(1)人書き要約はガイドラインに従わないものが多いため,必ずしも信頼できないものであって,(2)タスクの分解と反復的自己調整の組み合わせは,有望な議論参加能力を示している。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:33:35 GMT)
Winner-Take-All Column Row Sampling for Memory Efficient Adaptation of
Language Model [50.1] 分散を低減した行列生成のために, WTA-CRS と呼ばれる新しい非バイアス推定系を提案する。
我々の研究は、チューニング変換器の文脈において、提案した推定器が既存のものよりも低い分散を示すという理論的および実験的証拠を提供する。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:52:08 GMT)
Peek Across: Improving Multi-Document Modeling via Cross-Document
Question-Answering [49.9] 我々は,事前学習対象に答える新しいクロスドキュメント質問から,汎用的なマルチドキュメントモデルを事前学習する。
この新規なマルチドキュメントQA定式化は、クロステキスト情報関係をよりよく回復させるようモデルに指示する。
分類タスクや要約タスクに焦点を当てた従来のマルチドキュメントモデルとは異なり、事前学習対象の定式化により、短いテキスト生成と長いテキスト生成の両方を含むタスクを実行できる。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:48:40 GMT)
Multi-Modal Mutual Attention and Iterative Interaction for Referring
Image Segmentation [49.6] 本稿では,自然言語表現によって指定された対象のマスクを生成することを目的とした画像分割の参照問題に対処する。
本稿では,2つの入力モダリティから情報を取り出すためのマルチモーダル・ミューチュアル・アテンション(mathrmM3Att$)とマルチモーダル・ミューチュアル・デコーダ(mathrmM3Dec$)を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:26:05 GMT)
Making Large Language Models Better Reasoners with Step-Aware Verifier [49.2] DIVERSE(Diverse Verifier on Reasoning Step)は、言語モデルの推論能力をさらに強化する新しいアプローチである。
最新の言語モデルであるcode-davinci 上で DIVERSE を評価し,8つの推論ベンチマークのうち6つで新たな最先端結果が得られることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:08:08 GMT)
Drafting Event Schemas using Language Models [48.8] 複雑なイベントを記述するためにこのようなスキーマを作成するプロセスに注目します。
私たちの焦点は、十分な多様性と重要なイベントのリコールを達成できるかどうかにあります。
大規模言語モデルは、2つの異なるデータセットから取り出されたスキーマに対して適度なリコールを達成することができることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:57:04 GMT)
Can Current Task-oriented Dialogue Models Automate Real-world Scenarios
in the Wild? [48.8] タスク指向対話(TOD)システムは、主にスロット充填ベースのTOD(SF-TOD)フレームワークに基づいている。
現在のTODベンチマークは、現実のシナリオをサロゲートするために限られており、現在のTODモデルは、シナリオをカバーするための長い道のりである、と我々は主張する。
WebTODでは、対話システムは、人間のエージェントが対話するWeb/モバイルインターフェースの理解方法を学ぶ。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:46:33 GMT)
A vertical gate-defined double quantum dot in a strained germanium
double quantum well [48.8] シリコン-ゲルマニウムヘテロ構造におけるゲート定義量子ドットは、量子計算とシミュレーションのための魅力的なプラットフォームとなっている。
ひずみゲルマニウム二重量子井戸におけるゲート定義垂直2重量子ドットの動作を実証する。
課題と機会を議論し、量子コンピューティングと量子シミュレーションの潜在的な応用について概説する。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:45:02 GMT)
OR-NeRF: Object Removing from 3D Scenes Guided by Multiview Segmentation
with Neural Radiance Fields [48.2] 本稿では, OR-NeRF と呼ばれる新しい物体除去パイプラインを提案する。
提案アルゴリズムでは,すべてのビューにユーザアノテーションを高速に展開するポイントプロジェクション戦略を用いて,処理負担を大幅に削減する。
実験結果から,本手法は品質と量の両方を考慮して,従来よりも少ない時間で編集品質を向上することが示された。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:32:11 GMT)
A Computational Inflection for Scientific Discovery [48.2] 我々は科学的な発見の軌跡において、かなりの屈折の足元に立っている。
社会が急速に成長するデジタルトランスフォーメーションを継続するにつれて、人類の集団的な科学的知識も同様である。
コンピュータ科学は科学プロセス自体に革命を起こそうとしている。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:27:49 GMT)
Who Wrote this Code? Watermarking for Code Generation [47.6] そこで本研究では,機械生成コードの透かしにおける従来の手法を大幅に改善する新しい透かし手法であるSWEETを提案する。
コード生成ベンチマーク実験により,従来のLLM透かし法と比較すると,透かしコードの品質が向上していることがわかった。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:49:52 GMT)
A Neural Space-Time Representation for Text-to-Image Personalization [46.8] テキスト・ツー・イメージのパーソナライズ手法の重要な側面は、生成プロセス内でターゲット概念が表現される方法である。
本稿では,デノナイジングプロセスの時間ステップ(時間)とデノナイジングU-Netレイヤ(空間)の両方に依存する新しいテキストコンディショニング空間について検討する。
時空表現における単一の概念は、時間と空間の組み合わせごとに数百のベクトルで構成されており、この空間を直接最適化することは困難である。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:53:07 GMT)
The Crucial Role of Normalization in Sharpness-Aware Minimization [46.7] Sharpness-Aware Minimization (SAM)は勾配に基づくニューラルネットワークであり、予測性能を大幅に向上させる。
正規化の2つの性質がSAMを超実用性の選択に対して堅牢にすると主張する。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:09:41 GMT)
IdEALS: Idiomatic Expressions for Advancement of Language Skills [46.4] 本稿では,学生書記における慣用的表現の活用の課題について検討する。
そこで本研究では,実世界のデータを用いて,広範囲なトレーニングセットと専門家アノテートテストセットをキュレートし,さまざまなアプローチを評価し,その性能を人的専門家と比較する。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:25:55 GMT)
PURR: Efficiently Editing Language Model Hallucinations by Denoising
Language Model Corruptions [46.0] 我々は、大言語モデルの力を利用して、テキストに汚職を導入します。
関係する証拠を取り入れることで、汚職を軽視するコンパクトエディターを微調整する。
我々の方法論は完全に教師なしであり、あらゆる領域でのトレーニングのための偽の幻覚を与えてくれる。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:59:00 GMT)
LLM Itself Can Read and Generate CXR Images [45.8] 本研究では,事前学習したLLMを微調整し,構造変化を伴わずにテキストなどの画像を読み出し生成する手法を提案する。
本稿では,視覚領域と言語領域の複雑な情報の翻訳が重要である領域として,X線画像とレポート生成タスクを胸部に適用する。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:27:41 GMT)
PaCE: Unified Multi-modal Dialogue Pre-training with Progressive and
Compositional Experts [45.7] 本稿では,構造化された多モーダル対話事前学習フレームワークである textbfPaCE を提案する。
複数の対話関連タスクに対応するために、いくつかの基本的な専門家を組み合わせており、限られた対話と広範な非対話マルチモーダルデータを用いて事前訓練することができる。
実験の結果,PaCEは8つのマルチモーダルダイアログベンチマークで最先端の結果を得ることができた。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:43:29 GMT)
Attentiveness to Answer Choices Doesn't Always Entail High QA Accuracy [45.6] 大規模言語モデル(LM)は、複数選択質問などの識別タスクにゼロまたは少数ショット設定で適用される。
彼らの注意力は、有効な選択ではない多くの語彙トークンに分散している。
本稿では,この現象を研究するための数学的フォーマリズムを提案し,注意力の定量化のための計量値を提供し,それを高めるための簡単な手法を同定する。
論文参考訳(メタデータ) (Wed, 24 May 2023 00:27:00 GMT)
Is Summary Useful or Not? An Extrinsic Human Evaluation of Text
Summaries on Downstream Tasks [45.6] 本稿では,外部手法によるテキスト要約の有用性の評価に焦点をあてる。
我々は,要約の人間的評価,すなわち質問応答,テキスト分類,テキスト類似性評価のための3つの異なる下流タスクを設計する。
要約はテキストの全体的判断に依存するタスクにおいて特に有用であるが、質問応答タスクでは効果が低い。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:34:39 GMT)
The Art of SOCRATIC QUESTIONING: Zero-shot Multimodal Reasoning with
Recursive Thinking and Self-Questioning [44.5] CoT(Chain-of-Thought prompting)は、大規模な言語モデルにおいて、問題を分解し、ステップバイステップでそれに取り組むことで、複雑な推論問題を解決する。
この思考過程は、人間の複雑な問題へのアプローチとは異なる。
本稿では,自己問合せおよび再帰的思考過程をシミュレートする分散コンカレント・ファッション・アルゴリズムであるソクラティック・クセリングを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:36:14 GMT)
Mitigating Temporal Misalignment by Discarding Outdated Facts [43.9] 知識集約型タスクのキャリブレーションにおいて,モデル事実の持続時間がいかに改善されるかを示す。
私たちのデータとコードはhttps://github.com/mikejqzhang/mitigating_misalignment.comで公開されます。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:30:08 GMT)
Networks are Slacking Off: Understanding Generalization Problem in Image
Deraining [43.4] Deep deraining Networkは、現実世界のアプリケーションにデプロイする際、一定の一般化問題に一貫して遭遇する。
ディープラーニングにおける一般的な視点は、よりリッチな画像コンテンツ知識が一般化問題の克服を促進することを期待して、非常に複雑なトレーニングデータの使用を促進する。
我々の研究は、低レベルの視覚タスクにおける一般化問題をよりよく理解するための貴重な視点と方法論を提供する。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:27:11 GMT)
LogicLLM: Exploring Self-supervised Logic-enhanced Training for Large
Language Models [43.3] 本稿では,自己指導型ポストトレーニングによる論理的知識の活用の可能性について検討する。
我々はMERItの自己回帰的目的変数を考案し、パラメータサイズが30億から13億の2つのLLM系列、すなわちFLAN-T5とLLaMAと統合する。
2つの挑戦的な論理的推論ベンチマークの結果は、LogicLLMの有効性を示している。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:38:41 GMT)
ComSL: A Composite Speech-Language Model for End-to-End Speech-to-Text
Translation [43.2] 公的な事前訓練された音声のみのモデルと言語のみのモデルからなる複合アーキテクチャ上に構築された音声言語モデルであるComSLを提案する。
提案手法は,エンドツーエンドの音声-テキスト翻訳タスクにおいて有効であることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:42:15 GMT)
SAMScore: A Semantic Structural Similarity Metric for Image Translation
Evaluation [42.9] 本稿では,画像翻訳モデルの忠実度を評価するための意味的構造類似度指標SAMScoreを紹介する。
SAMScoreは最近のSAM(High- Performance Segment Anything Model)に基づいている。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:22:39 GMT)
Causal Discovery with Unobserved Variables: A Proxy Variable Approach [42.6] 本研究では,未観測変数が存在する場合の因果関係を特定するためのプロキシベースの仮説テストを提案する。
私たちのテストは一貫性があり、大規模なサンプルが入手可能な場合に理想的なパワーを持つ。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:50:00 GMT)
On the Generalization of Diffusion Model [42.4] 生成したデータとトレーニングセットの相互情報によって測定される生成モデルの一般化を定義する。
実験的最適拡散モデルでは, 決定論的サンプリングによって生成されたデータは, すべてトレーニングセットに強く関連しており, 一般化が不十分であることを示す。
本稿では,経験的最適解が一般化問題を持たない別の学習目標を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:27:57 GMT)
Mitigating Biased Activation in Weakly-supervised Object Localization
via Counterfactual Learning [42.1] 本稿では,従来の弱教師付オブジェクトローカライゼーション手法におけるバイアス付アクティベーションの未検討問題に焦点をあてる。
本稿では, 対実表現を合成するために, 対実共起学習パラダイムを提案する。
いくつかのベンチマークの実験では、反現実的CAMは偏りのあるアクティベーション問題を緩和することに成功した。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:07:30 GMT)
On Correlated Knowledge Distillation for Monitoring Human Pose with
Radios [41.7] 我々は,無線周波数(RF)センシング技術と相関知識蒸留(CKD)理論を結合させることにより,新しいアイデアの実現可能性を検討するための簡易な実験ベッドを提案し,開発する。
提案したCKDフレームワークは,ロバストな"Teacher"モデルからパラメータ化された"Student"モデルへの知識の伝達とヒューズを行う。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:34:49 GMT)
Rethinking Existential First Order Queries and their Inference on
Knowledge Graphs [41.3] 一階述語論理式は、その明確な構文と意味論のために特に興味深い。
証明可能な推論能力を持つファジィ論理理論から新しい推論アルゴリズムを提案する。
実験結果から,本手法は,新たなデータセットと既存データセットの両方において,従来の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:58:08 GMT)
InteractiveIE: Towards Assessing the Strength of Human-AI Collaboration
in Improving the Performance of Information Extraction [41.0] 文書からテンプレートをベースとした学習情報抽出の性能向上を図るために,対話IE(InteractiveIE)と呼ばれるプロキシをオンザフライで行う方法を提案する。
バイオメディカルおよび法的文書の実験では、トレーニングデータを取得するのが高価であり、AIのみのベースラインよりもInteractiveIEを使用したパフォーマンス改善の奨励的な傾向が明らかにされている。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:53:22 GMT)
Sin3DM: Learning a Diffusion Model from a Single 3D Textured Shape [40.5] Sin3DMは1つの3次元テクスチャ形状から内部パッチ分布を学習する拡散モデルである。
また,本モデルでは,従来の手法よりも高品質な3次元形状を生成可能であることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:57:15 GMT)
Rethinking the Evaluation Protocol of Domain Generalization [40.4] ドメインの一般化は、アウト・オブ・ディストリビューションの一般化の課題を解決することを目的としている。
本稿では、現在のプロトコルの2つの側面において、テストデータ情報漏洩の潜在的なリスクについて検討する。
我々は,複数のテスト領域をスクラッチからトレーニングすることで,OODの一般化能力をより正確に評価できることを示した。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:36:46 GMT)
Selective Explanations: Leveraging Human Input to Align Explainable AI [40.3] 人間の入力を小さなサンプルに利用して選択的な説明を生成するための一般的なフレームワークを提案する。
事例として,意思決定支援タスクを用いて,意思決定者が決定タスクにどう関係するかに基づいて,選択的な説明を探索する。
我々の実験は、AIへの過度な依存を減らすための選択的な説明の可能性を実証している。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:00:37 GMT)
How Predictable Are Large Language Model Capabilities? A Case Study on
BIG-bench [40.0] 大規模言語モデル(LLM)の機能の予測可能性について検討する。
BIGベンチ実験記録の性能予測問題について検討した。
BIG-bench Hardとして新しいモデルファミリーを評価する上で,サブセットは3倍小さい。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:35:34 GMT)
Enhancing Cross-lingual Prompting with Dual Prompt Augmentation [39.7] 本稿では,ソース言語学習とターゲット言語推論の相違を緩和するUniversal Promptingを提案する。
XNLIでは、クラスごとの英語学習例は16例のみで46.54%、ファインタニングの34.99%を大きく上回っている。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:03:28 GMT)
What can generic neural networks learn from a child's visual experience? [39.6] 我々は、子供の視覚的体験のリアルなプロキシ上で、最先端のニューラルネットワークをトレーニングする。
埋め込みモデルと生成モデルの両方を、1人の子供から200時間のヘッドカムビデオでトレーニングします。
私たちは他の2人の子供と実験を再現し、非常によく似た結果を見つけました。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:26:59 GMT)
Improving Empathetic Dialogue Generation by Dynamically Infusing
Commonsense Knowledge [39.5] 共感的な会話では、個人は他人に対する共感を表現する。
これまでの研究は主に、話者の感情を利用して共感的な反応を生み出すことに焦点を当ててきた。
本稿では,コモンセンス知識選択のための適応モジュールを組み込んだ共感応答生成手法を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:25:12 GMT)
VisorGPT: Learning Visual Prior via Generative Pre-Training [39.4] この作業は、視覚的事前学習を明確にし、サンプリングのカスタマイズを可能にすることを目的としている。
言語モデリングの進歩に触発されて、私たちはVisorGPTと呼ばれるジェネレーティブ・プレトレーニングを通してビジュアル・プレトレーニングを学ぶことを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:18:13 GMT)
Think Before You Act: Decision Transformers with Internal Working Memory [39.3] 大規模言語モデル(LLM)に基づく意思決定エージェントは、複数のタスクをまたいで一般化する能力を示している。
この非効率性は、モデルがトレーニングを通してパラメータの振る舞いを記憶する忘れ現象に起因していると我々は主張する。
本稿では,異なる下流タスクの情報を格納,ブレンド,検索するための内部動作メモリモジュールを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 01:20:22 GMT)
Unlocking Temporal Question Answering for Large Language Models Using
Code Execution [38.9] 大規模言語モデル(LLM)は自然言語処理(NLP)において大きな進歩を遂げている。
本稿では,LLMの抽出能力とPythonソルバの論理的推論能力を組み合わせた新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:57:53 GMT)
I Spy a Metaphor: Large Language Models and Diffusion Models Co-Create
Visual Metaphors [38.7] 言語メタファーから視覚的メタファーを生成するための新しい課題を提案する。
これは、暗黙的な意味と構成性をモデル化する能力を必要とするため、拡散ベースのテキスト-画像モデルにとって難しいタスクである。
我々は1,540の言語メタファーとそれに関連する視覚的エラボレートのための6,476の視覚的メタファーを含む高品質なデータセットを作成する。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:01:10 GMT)
SVDinsTN: An Integrated Method for Tensor Network Representation with
Efficient Structure Search [38.3] SVDにインスパイアされたTN分解(SVDinsTN)という,効率的な統合(単一レベル)手法を提案する。
完全接続されたTNの各エッジに対角係数を挿入することにより、TNコアと対角因子を同時に計算し、最もコンパクトなTN構造を示す因子の空間性を明らかにする。
実世界のデータによる実験の結果、SVDinsTNは実行時に約102sim103$の加速を達成した。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:02:01 GMT)
CAR: Conceptualization-Augmented Reasoner for Zero-Shot Commonsense
Question Answering [38.3] ゼロショットコモンセンス質問応答の課題に対処するために,概念化強化推論器(CAR)を提案する。
CARは、CommonSenseの知識を多くの高レベルなインスタンスに抽象化し、CommonSenseの知識ベースの範囲を拡大する。
CARは、既存のメソッドよりも、ゼロショットのコモンセンスシナリオに関する質問に答えることにより、より堅牢に一般化する。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:21:31 GMT)
Leveraging LLMs for KPIs Retrieval from Hybrid Long-Document: A
Comprehensive Framework and Dataset [38.1] 本研究は,財務報告から重要な情報を理解するために,大規模言語モデルの可能性を活用することに焦点を当てる。
財務報告から情報を理解し抽出するLLMの能力を高める自動財務情報抽出フレームワークを提案する。
本フレームワークは, GPT-3.5とGPT-4で有効に検証され, 平均精度は53.94%, 33.77%向上した。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:35:58 GMT)
ZITS++: Image Inpainting by Improving the Incremental Transformer on
Structural Priors [38.0] ゼロd残差加算に基づくインクリメンタルトランスの学習について,ZITS++を用いて検討する。
具体的には, 1つの劣化画像が与えられた場合, 低解像度で全体構造を復元するTransformer Structure Restorer (TSR) モジュールを提示する。
また, インペイントにおける様々な画像先行の影響について検討し, 高分解能画像インペイントへの利用方法について検討する。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:19:01 GMT)
Estimating Large Language Model Capabilities without Labeled Test Data [38.0] LLM(Large Language Models)は、いくつかの例からICL(In-context Learning)を実行する素晴らしい能力を示した。
ICLの精度推定のタスクを提案し、新しいタスクで文脈内学習を行う場合のLLMの精度を予測する。
提案手法を,4つのLLMと3つのタスクコレクションをカバーする新しいベンチマークを用いて,精度の高い推定基準値と比較した。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:55:09 GMT)
ClusterLLM: Large Language Models as a Guide for Text Clustering [37.9] ClusterLLMはChatGPTのような命令調整された大きな言語モデルからのフィードバックを使用する。
クラスタリングの品質を継続的に改善し、データセットあたりの平均コストは0.6ドルである。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:24:25 GMT)
When the Majority is Wrong: Modeling Annotator Disagreement for
Subjective Tasks [37.8] ヘイトスピーチの検出における重要な問題は、ある声明が人口集団に対して攻撃的であるかどうかを決定することである。
我々は、潜在的に攻撃的なテキストに基づいて、個々のアノテータ評価を予測するモデルを構築した。
その結果、アノテータの評価は、その人口統計情報とオンラインコンテンツに関する意見を用いて予測できることがわかった。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:57:08 GMT)
Newton-Cotes Graph Neural Networks: On the Time Evolution of Dynamic
Systems [37.7] 本稿では,ニュートン・コーツの公式を用いた速度推定に基づく積分の予測手法を提案する。
いくつかのベンチマークの実験は、最先端の手法と比較して、一貫性と顕著な改善を実証的に示している。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:23:00 GMT)
Rethinking Semi-Supervised Medical Image Segmentation: A
Variance-Reduction Perspective [37.7] 医用画像セグメンテーションのための階層化グループ理論を用いた半教師付きコントラスト学習フレームワークARCOを提案する。
まず、分散還元推定の概念を用いてARCOを構築することを提案し、特定の分散還元技術が画素/ボクセルレベルのセグメンテーションタスクにおいて特に有用であることを示す。
5つの2D/3D医療データセットと3つのセマンティックセグメンテーションデータセットのラベル設定が異なる8つのベンチマークで、我々のアプローチを実験的に検証する。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:11:28 GMT)
TinyStories: How Small Can Language Models Be and Still Speak Coherent
English? [37.7] 言語モデル(LM)は、小さくて一貫性があり、流動的なテキストを生成するのに苦労することが多い。
TinyStoriesを紹介します。これは、典型的な3~4歳の人が通常理解している単語のみを含む短いストーリーのデータセットです。
我々はTinyStoriesを用いて,最先端モデルよりもはるかに小さいLMをトレーニングし,評価することができることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 23:30:43 GMT)
In-Context Impersonation Reveals Large Language Models' Strengths and
Biases [37.3] 我々は、視覚と言語タスクを解く前に、LLMに異なるペルソナを仮定するよう依頼する。
異なる年齢の子どものふりをしたLSMが、ヒトのような発達段階を回復することがわかった。
言語に基づく推論タスクでは、ドメインエキスパートを装うLLMが、ドメイン専門家を装うLLMよりも優れた性能を発揮する。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:13:15 GMT)
Learning Semantic Role Labeling from Compatible Label Sequences [37.1] 本稿では,不整合なラベル配列から効率的に学習する方法の課題に対処する。
本稿では,VerbNetとPropBankのラベルを1つのシーケンスとして共同で扱う,シンプルで効果的なセットアップを提案する。
我々のモデルは、CoNLL05データセットにラベル付けしたVerbNetとPropBankのF1の最先端化を実現している。
論文参考訳(メタデータ) (Wed, 24 May 2023 00:46:02 GMT)
Deep Reinforcement Learning with Plasticity Injection [37.0] 深層強化学習(RL)ネットワークでは、可塑性が徐々に低下することを示す証拠がある。
可塑性注入はパラメータの数を変更せずにネットワーク可塑性を増加させる。
可塑性注入は 代替方法に比べて より強い性能を得る
論文参考訳(メタデータ) (Wed, 24 May 2023 20:41:35 GMT)
Multitrack Music Transformer [36.9] 短いシーケンス長を維持しながら多様な楽器のセットを表現できる新しいマルチトラック音楽表現を提案する。
提案するMultitrack Music Transformer (MMT) は,最先端システムと同等の性能を実現する。
論文参考訳(メタデータ) (Wed, 24 May 2023 20:49:16 GMT)
POEM: Reconstructing Hand in a Point Embedded Multi-view Stereo [36.7] マルチビューステレオに埋め込まれた3Dポインツを動作させて手メッシュを再構築する,POEMという新しい手法を提案する。
そこで本手法は,複雑な3Dハンドメッシュを,1)多視点ステレオに埋め込まれた3Dポイントの集合で表現し,2)多視点画像から特徴を引き出す,3)手を取り囲む,という,シンプルで効果的なアイデアを念頭に置いている。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:13:43 GMT)
DialogVCS: Robust Natural Language Understanding in Dialogue System
Upgrade [36.4] 製品対話システムの定期的な更新では、実際のユーザからの新たなデータが既存のデータにマージされる。
新しい意図が出現し、既存の意図と意味的な絡み合いを持つかもしれない。
4つの対話バージョン管理データセット(VCS)からなる新しいベンチマークをセットアップする。
システム更新における不完全なデータによる意図検出を,肯定的かつ未定な意図を持つ多ラベル分類タスクとして定式化する。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:53:38 GMT)
Make Transformer Great Again for Time Series Forecasting: Channel
Aligned Robust Dual Transformer [36.1] 近年の研究では、時系列予測のためのディープラーニング手法、特にTransformerの強大な力を実証している。
NLPとCVで成功したにもかかわらず、多くの研究でTransformerは時系列予測よりも効果が低いことが判明した。
本研究では,時系列予測におけるTransformerの重要な欠点に対処する特別なTransformer(略してCARD)を設計する。
論文参考訳(メタデータ) (Wed, 24 May 2023 22:25:38 GMT)
Debiasing Made State-of-the-art: Revisiting the Simple Seed-based Weak
Supervision for Text Classification [36.0] 擬似ラベルを生成する最も単純な方法であるシードマッチング法を再検討する。
種マッチングの限界性能は, 単純な種マッチ規則によって誘導されるラベルバイアスが原因であることが示唆された。
入力テキスト中の単語トークンを高い削除率でランダムに削除することを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:45:33 GMT)
IconShop: Text-Guided Vector Icon Synthesis with Autoregressive
Transformers [36.0] 自動回帰変換器を用いたテキスト誘導ベクトルアイコン合成法であるIconShopを導入する。
IconShopは、既存の画像ベースや言語ベースの方法よりも優れたアイコン合成機能を備えている。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:45:42 GMT)
Unit-based Speech-to-Speech Translation Without Parallel Data [35.8] ソースとターゲット言語間の並列データに依存しない教師なし音声音声翻訳システム(S2ST)を提案する。
提案手法は,ソースおよびターゲット言語音声信号を自動で検出された離散単位にマッピングし,教師なし単位対単位機械翻訳として問題を再構成する。
合成話者のEuroparl-ST英語とドイツ語の評価セットについて,この制約されたシナリオ下では単位ベース翻訳が可能であることが確認された。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:59:05 GMT)
Robust Classification via a Single Diffusion Model [35.7] ロバスト拡散(RDC)は、事前訓練された拡散モデルから構築され、逆向きに堅牢である。
RDCはそれまでの最先端の対人訓練モデルを2.34%以上上回っている。
本研究は, 逆方向の堅牢性に拡散モデルを用いることにより, 生成型分類器の可能性を明らかにするものである。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:25:19 GMT)
A RelEntLess Benchmark for Modelling Graded Relations between Named
Entities [35.7] 我々は,与えられた次数関係をどの程度満たすかに応じて,エンティティペアをランク付けしなければならない新しいベンチマークを導入する。
モデルのサイズと性能の間には強い相関関係があり、より小さな言語モデルでは単純なベースラインを上回りません。
最大のFlan-T5およびOPTモデルの結果は極めて強いが、人間のパフォーマンスとの明確なギャップは残る。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:41:24 GMT)
PMC-VQA: Visual Instruction Tuning for Medical Visual Question Answering [35.6] 医用視覚質問応答(MedVQA)の問題点に焦点をあてる。
本稿では,事前学習した視覚エンコーダの視覚情報を大規模言語モデルに整列させることにより,医用視覚理解のための生成モデルを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:35:13 GMT)
HINT: Hypernetwork Instruction Tuning for Efficient Zero- & Few-Shot
Generalisation [35.5] 最近のNLPモデルは、自然言語指示のみを指導として、ゼロショットを新しいタスクに効果的に一般化する能力を示している。
これらのアプローチは、全ての入力例と長い命令の連結に依存するため、高い計算コストに悩まされる。
本稿では,Hypernetworks for Instruction Tuning (HINT)を紹介し,タスク命令や例をパラメータ効率のよいモジュールに変換する。
論文参考訳(メタデータ) (Wed, 24 May 2023 22:30:30 GMT)
Prefix Propagation: Parameter-Efficient Tuning for Long Sequences [35.2] 従来の隠蔽状態に対してプレフィックスを条件づける,単純かつ効果的な手法であるプレフィックスプロパゲーションを提案する。
我々は,長期文書作成作業におけるプレフィックス・プロパゲーションがプレフィックス・チューニングより優れていることを実証的に示す。
我々の知る限りでは、この研究は長文言語タスクのためのパラメータ効率の学習に最初に焦点をあてるものである。
論文参考訳(メタデータ) (Wed, 24 May 2023 21:13:24 GMT)
Improving Language Models with Advantage-based Offline Policy Gradients [35.0] left-over Lunch RL (LoL-RL) は、言語生成タスクのオフラインポリシー勾配を1ステップのRLゲームとして使用する単純なトレーニングアルゴリズムである。
LoL-RLはLMを微調整して任意の分類器ベースまたは人間定義ユーティリティ関数を任意のシーケンス対シーケンスデータで最適化することができる。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:42:17 GMT)
WeiAvg: Federated Learning Model Aggregation Promoting Data Diversity [35.0] フェデレーション学習は、IoT(Internet-of-Things)デバイスからの大規模プライベートエッジデータを活用するための、有望なプライバシ保護方法を提供する。
重要でしばしば見落とされがちな側面の1つは、参加者がデータから予測的な知識を提供し、学習したフェデレーションモデルの品質に影響を与えることである。
本稿では、高多様性クライアントからの更新を重視し、低多様性クライアントからの更新の影響を低減した重み付き平均化フレームワークを導入することにより、この問題に対処する新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 21:34:36 GMT)
Modeling Appropriate Language in Argumentation [34.9] 議論において適切な言語を初めて運用する。
オンライン議論において不適切な言語を決定する14の次元の新しい分類法を導出する。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:17:05 GMT)
KNN-LM Does Not Improve Open-ended Text Generation [34.9] 検索強化言語モデル(LM)の生成品質について検討する。
検索分布の補間は, ベースライントランスフォーマーLMと比較して, 実際にパープレキシティを増大させることがわかった。
検索分布のエントロピーは、生成シーケンスが長くなるにつれて、ベースLMのエントロピーよりも速く増加する。
論文参考訳(メタデータ) (Wed, 24 May 2023 01:48:33 GMT)
Centering the Margins: Outlier-Based Identification of Harmed
Populations in Toxicity Detection [34.7] 人口統計特性が「ノーム」から離れたため、統計的外れ値であるデータポイントとして「マージン」を運用する。
本稿では,グループベース性能格差指数(GPDI)を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:15:36 GMT)
Topic-Guided Self-Introduction Generation for Social Media Users [34.4] 本稿では,ユーザの個人的関心を概説した短い文章として,ソーシャルメディアの自己導入の自己生成について考察する。
ここでは、ユーザのツイート履歴を利用して自己導入を生成する。
本稿では,新しいトピック誘導型エンコーダデコーダフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:35:08 GMT)
Shadow Cones: Unveiling Partial Orders in Hyperbolic Space [34.3] 本稿では、一般多様体上の部分順序を定義するための物理的に直感的な解釈を提供する革新的なフレームワークであるシャドウコーンについて述べる。
この結果から,シャドーコーンはWordNetやConceptNetなど,さまざまなデータセットに対して,堅牢な表現と一般化機能を提供することが示唆された。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:52:56 GMT)
The Larger They Are, the Harder They Fail: Language Models do not
Recognize Identifier Swaps in Python [34.1] 大規模言語モデル(LLM)は、コード生成タスクにうまく適用されている。
デフォルト関数名がスワップされた場合、LLMは正しいPythonコードを生成することができないことを示す。
モデルのサイズが大きくなるにつれて、それらのいくつかは誤った予測に自信を持つようになる。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:54:39 GMT)
Towards View-invariant and Accurate Loop Detection Based on Scene Graph [33.7] ループ検出は、蓄積されたポーズドリフトを補正することで視覚SLAMにおいて重要な役割を果たす。
現在のセマンティック支援ループ検出手法は、あいまいなセマンティックインスタンスと劇的な視点差を扱う際の課題に直面している。
本稿では,段階的に生成されたシーングラフに基づく新しいループ検出手法を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:34:43 GMT)
Training Energy-Based Normalizing Flow with Score-Matching Objectives [33.5] エネルギーベース正規化フロー(EBFlow)と呼ばれる新しいフローベースモデリング手法を提案する。
本研究では,EBFlowをスコアマッチング目的に最適化することにより,線形変換に対するヤコビ行列式の計算を完全に回避できることを実証する。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:54:29 GMT)
Flexible Grammar-Based Constrained Decoding for Language Models [33.4] 本稿では,形式的な文法制約でデコードを強化することを提案する。
我々のフレームワークは、任意のCFGやデコードアルゴリズムと簡単に組み合わせることができる。
我々は,多くのNLPタスクの出力を形式言語として表現できることを実証した。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:51:52 GMT)
Learning Meta Representations of One-shot Relations for Temporal
Knowledge Graph Link Prediction [33.4] 近年,静的知識グラフ(KG)のリレーショナル学習が注目されている。
TKGには豊富な時間情報が含まれており、モデリングには時間的推論技術が必要である。
これは、時間的文脈で少数のショットの関係を学ぶ上で大きな課題となる。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:01:36 GMT)
From Tempered to Benign Overfitting in ReLU Neural Networks [33.3] 過自明なニューラルネットワーク(NN)は、ノイズの多いデータに完全に適合するように訓練された場合でも、適切に一般化することが観察される。
最近、NNの振舞いは「抑止過剰」と表現されることが多いと推測され、実証的に観察された。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:36:06 GMT)
PastNet: Introducing Physical Inductive Biases for Spatio-temporal Video
Prediction [33.3] 本研究では,過去のデータストリーム上での映像生成に関わる時間的映像予測の課題について検討する。
高品質な予測を生成するために,時空間ネットワーク(PastNet)と呼ばれる新しい手法を導入する。
複素時間信号の処理中に局所的な特徴を識別するために,固有次元の推定値を持つメモリバンクを用いる。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:00:38 GMT)
On progressive sharpening, flat minima and generalisation [33.1] 深層学習における損失曲率と一般化の関係を理解するための新しいアプローチを提案する。
具体的には、ディープ・ネットワーク・ロス・ヘッセンのスペクトルを実験的に分析し、ロス・ヘッセンとディープ・ニューラル・ネットワークの入出力ヤコビアンを結びつけるアンザッツを接地する。
次に、モデルの入出力ヤコビアンがそのデータ分布上のリプシッツノルムに近似する度合いを定量化する一連の理論的結果を示し、経験的ヤコビアンの観点から有界な新しい一般化を導出する。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:44:50 GMT)
DetGPT: Detect What You Need via Reasoning [33.0] 我々は、推論に基づくオブジェクト検出と呼ばれる、オブジェクト検出のための新しいパラダイムを導入する。
特定のオブジェクト名に依存する従来のオブジェクト検出方法とは異なり,本手法では自然言語命令を用いてシステムと対話することが可能である。
提案手法はDetGPTと呼ばれ,最先端のマルチモーダルモデルとオープンボキャブラリオブジェクト検出器を利用する。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:51:37 GMT)
Towards Adaptive Prefix Tuning for Parameter-Efficient Language Model
Fine-tuning [32.8] ゲート機構により,粒度の細かいトークンレベルと粗い層レベルの両方でプレフィックスを調整できる適応型プリフィックスチューニング(APT)を提案する。
SuperGLUEとNERデータセットの実験は、APTの有効性を示している。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:51:01 GMT)
Revisit and Outstrip Entity Alignment: A Perspective of Generative
Models [32.2] 組込み型エンティティアライメント(EEA)を生成モデルの観点から検討する。
脳波は典型的生成モデルにおける主目的がそれと類似している特別な問題であることを示す。
そして、それらの不完全な目的が、エンティティアライメントとエンティティ合成の両方の能力を制限することを明らかにする。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:39:20 GMT)
From Shortcuts to Triggers: Backdoor Defense with Denoised PoE [32.1] 言語モデルは、しばしば多様なバックドア攻撃、特にデータ中毒の危険にさらされる。
既存のバックドア防御手法は主に明示的なトリガーによるバックドア攻撃に焦点を当てている。
我々は,様々なバックドア攻撃を防御するために,エンド・ツー・エンドアンサンブルに基づくバックドア防御フレームワークDPoEを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:59:25 GMT)
PESCO: Prompt-enhanced Self Contrastive Learning for Zero-shot Text
Classification [32.0] PESCOは、ゼロショットテキスト分類の性能を大幅に向上させる、対照的な学習フレームワークである。
PESCOは4つのベンチマークテキスト分類データセット上で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:57:06 GMT)
STAR: Boosting Low-Resource Event Extraction by Structure-to-Text Data
Generation with Large Language Models [31.9] 低リソースイベント抽出性能を高めるために、限られた種実演を与えられたデータインスタンスを合成することを提案する。
ステップ・バイ・ステップの詳細な手順を設計し,エラー事例と品質問題を自己修正することができる。
実験の結果,STARによって生成されたデータは,低リソースのイベント抽出性能を大幅に向上させることができることがわかった。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:15:19 GMT)
Is GPT-4 a Good Data Analyst? [31.8] 我々は、GPT-4を、広範囲のドメインのデータベースでエンドツーエンドのデータ分析を行うためのデータ分析であると考えている。
我々は,複数の専門家データアナリストとGPT-4のパフォーマンスを体系的に比較するために,タスク固有の評価指標を設計する。
実験の結果, GPT-4はヒトに匹敵する性能を示した。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:26:59 GMT)
TACR: A Table-alignment-based Cell-selection and Reasoning Model for
Hybrid Question-Answering [31.8] テキストとテーブルQAのハイブリッド化を目的としたテーブルアライメントに基づくセル選択・推論モデル(TACR)を提案する。
証拠検索において,我々は詳細な証拠を検索するテーブルクエストアライメント強化セル選択法を設計する。
回答推論では、選択されたセルを含む行をコンテキストとして扱うQAモジュールを組み込む。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:42:44 GMT)
EvEval: A Comprehensive Evaluation of Event Semantics for Large Language
Models [31.7] イベントは様々な文脈で発生の基本的な単位として機能する。
最近の研究は、イベントセマンティック処理に対処するために大きな言語モデル(LLM)を活用し始めている。
本稿では,イベントセマンティック処理における理解,推論,予測を包含する包括的なフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:55:40 GMT)
PopulAtion Parameter Averaging (PAPA) [31.7] 本稿では,アンサンブルの一般性と重量平均化の効率を結合する手法であるPopulAtion Averaging (PAPA)を提案する。
CIFAR-10では最大で0.8%、CIFAR-100では1.9%、ImageNetでは1.6%となる。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:55:52 GMT)
Ghostbuster: Detecting Text Ghostwritten by Large Language Models [31.6] 本稿では,AI生成テキストを検出するシステムであるGhostbusterを紹介する。
我々の手法は、文書をより弱い言語モデルに渡すことで機能する。
検出ベンチマークとして、人間とAIが生成したテキストの3つの新しいデータセットをリリースする。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:37:10 GMT)
Fenrir: Physics-Enhanced Regression for Initial Value Problems [31.4] 確率数値を用いて初期値問題をガウス-マルコフ過程に変換する方法を示す。
提案手法は競合する手法よりも適度か適度に優れていることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:15:15 GMT)
PruMUX: Augmenting Data Multiplexing with Model Compression [31.3] 本稿では、構造化プルーニングとデータ多重化という2つの手法を組み合わせて、どちらの手法でも得られる高速化ゲインを合成する。
我々のアプローチであるPruMUXは、精度が80%から74%のBERTベースモデルよりも7.5-29.5倍のスループット向上を実現している。
我々は,所望の精度損失予算を条件として,プルーニングと多重化の高性能パラメータを予測できるメタレベルモデルであるAuto-PruMUXを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:22:38 GMT)
Referral Augmentation for Zero-Shot Information Retrieval [30.8] Referral-Augmented Retrieval (RAR)は、ドキュメントインデックスと参照をリンクするシンプルなテクニックである。
RARはスパースとディープレトリバーの両方で動作し、生成テキスト拡張技術より優れている。
マルチリフレラルアグリゲーションのための様々な手法を解析し、再学習せずに最新の情報検索を可能にすることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:28:35 GMT)
An Informative Path Planning Framework for Active Learning in UAV-based
Semantic Mapping [30.7] 無人航空機(UAV)は、航空地図や一般的な監視作業に頻繁に使用される。
近年のディープラーニングの進歩により、画像の自動セマンティックセグメンテーションが実現され、大規模な複雑な環境の解釈が容易になった。
モデル再学習のための情報的訓練画像を自律的に取得するための,UAVのための新しい汎用的計画フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:52:05 GMT)
Video ChatCaptioner: Towards Enriched Spatiotemporal Descriptions [30.7] 動画からダイナミックなシーンを伝えるビデオキャプションは、自然言語の理解を深める。
本稿では,より包括的なビデオ記述を作成するための革新的なアプローチであるVideo ChatCaptionerを紹介する。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:01:54 GMT)
Denoising Bottleneck with Mutual Information Maximization for Video
Multimodal Fusion [30.6] ビデオマルチモーダル融合は、ビデオにマルチモーダル信号を統合することを目的としている。
ビデオはより長いマルチモーダルシーケンスを持ち、より冗長性とノイズが視覚とオーディオのモダリティに富んでいる。
本稿では,微細なビデオ融合のためのボトルネック融合モデルを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:39:43 GMT)
Bi-Drop: Generalizable Fine-tuning for Pre-trained Language Models via
Adaptive Subnetwork Optimization [30.6] 本稿では,Bi-Dropと呼ばれる事前学習言語モデルの動的微調整戦略を提案する。
GLUEベンチマークの実験では、Bi-Dropは従来の微調整方法よりもかなり優れていた。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:09:26 GMT)
CoLaDa: A Collaborative Label Denoising Framework for Cross-lingual
Named Entity Recognition [30.3] NER(クロスランガルな名前付きエンティティ認識)は、与えられたソース言語でラベル付きデータを活用することで、ターゲット言語によく一般化するNERシステムを訓練することを目的としている。
過去の研究は、ソース言語ラベル付きデータを翻訳したり、ターゲット言語ラベルなしデータに対して知識蒸留を行うことで、データの不足を軽減した。
この問題に対処するために,協調ラベル記述フレームワークであるCoLaDaを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:03:01 GMT)
MuLER: Detailed and Scalable Reference-based Evaluation [30.2] そこで本研究では,テキスト生成のための基準ベース評価基準を細粒度解析ツールに変換する手法を提案する。
システムとメートル法が与えられたとき、MulERは選択されたメートル法が特定のエラータイプをどれだけ罰するかを定量化する。
我々は,MulERの有効性を実証し,その有用性を示すために,合成的および自然主義的な設定の両方で実験を行う。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:26:13 GMT)
DUBLIN -- Document Understanding By Language-Image Network [30.2] 3つの新しい目的を用いて,Webページ上で事前学習を行うDUBLINを提案する。
提案モデルでは,いくつかのベンチマークにおいて,競合や最先端の結果が得られている。
DUBLIN は WebSRC データセット上で 77.75 の EM と 84.25 の F1 を達成した最初のピクセルベースモデルであることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:03:56 GMT)
STOA-VLP: Spatial-Temporal Modeling of Object and Action for
Video-Language Pre-training [30.2] 本研究では,空間的・時間的次元にまたがる対象情報と行動情報を協調的にモデル化する事前学習フレームワークを提案する。
我々は,ビデオ言語モデルの事前学習プロセスに,両方の情報をよりうまく組み込むための2つの補助タスクを設計する。
論文参考訳(メタデータ) (Wed, 24 May 2023 01:03:09 GMT)
Instructions as Backdoors: Backdoor Vulnerabilities of Instruction
Tuning for Large Language Models [30.1] インストラクションチューニングされたモデルは、優れたパフォーマンスを達成するためにタスク命令を備えたクラウドソーシングデータセットに基づいて訓練される。
本研究は,数千件の収集データに悪意のある指示をほとんど出さずに,攻撃者がバックドアを注入できることを実証した。
攻撃者は4つの一般的に使用されているNLPデータセットで90%以上の攻撃成功率を達成することができ、永続的なバックドアが15の多様なデータセットに簡単に転送される。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:27:21 GMT)
Leveraging Pre-trained Large Language Models to Construct and Utilize
World Models for Model-based Task Planning [30.1] 事前訓練済みの大規模言語モデルをプランナーとして直接使用する方法は、計画の正確性に限界があるため、現在は実用的ではない。
本研究では,ドメイン定義言語(PDDL)の計画において,明示的な世界(ドメイン)モデルを構築し,ドメインに依存しないプランナで計画する新たなパラダイムを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:59:15 GMT)
A Causal View of Entity Bias in (Large) Language Models [29.9] ホワイトボックスとブラックボックスの設定の両方において,エンティティバイアスを軽減するための因果介入手法を提案する。
トレーニング時間の介入により,RoBERTaのF1スコアはEntREDの5.7ポイント向上した。
我々の文脈内介入は、GPT-3.5におけるパラメトリック知識と文脈知識との間の知識の衝突を効果的に軽減する。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:59:18 GMT)
A Controllable QA-based Framework for Decontextualization [29.9] 本稿では,デコンテクスト化のための質問応答フレームワークを提案する。
我々は,最先端のLCMがエンドツーエンドのアプローチと競合し続けていることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:23:02 GMT)
A Logic for Expressing Log-Precision Transformers [29.7] 本稿では,任意の対数精度変換器を一階述語論理文として等価に表現できることを示す。
これは、最も厳密な既知の上界であり、対数精度変換器の論理的特徴である。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:20:44 GMT)
Towards multi-document summarization in the open-domain [29.7] MDS(Multi-document summarization)は、伝統的にトピック関連の文書のセットが提供されると仮定する。
タスクを形式化し、既存のデータセット、レトリバー、要約器を使ってブートストラップすることで、より困難な"オープンドメイン"設定について研究する。
論文参考訳(メタデータ) (Wed, 24 May 2023 00:22:25 GMT)
Local Intrinsic Dimensional Entropy [29.5] ほとんどのエントロピー測度は、サンプル空間 $mathcalX|$ 上の確率分布の拡散に依存する。
本研究では,連続空間に対するエントロピー測度の定義において,濃度と分布の拡散が果たす役割について考察する。
分布の局所固有次元の平均値は、ID-エントロピー(ID-Entropy)と呼ばれ、連続空間の強エントロピー測度として機能する。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:43:14 GMT)
AVeriTeC: A Dataset for Real-world Claim Verification with Evidence from
the Web [29.3] AVeriTeCは、50の異なる組織によるファクトチェックをカバーする4,568の現実世界のクレームの新しいデータセットである。
それぞれのクレームには、オンラインで利用可能な証拠によって支持される質問と回答のペアと、証拠がどのように組み合わさって判断を下すかを説明する文章の正当性が含まれている。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:44:08 GMT)
Training on Thin Air: Improve Image Classification with Generated Data [29.0] Diffusion Inversionは、画像分類のための多種多様な高品質なトレーニングデータを生成するための、シンプルで効果的な方法である。
提案手法は,元のデータ分布を捕捉し,画像を安定拡散の潜在空間に反転させることにより,データカバレッジを確保する。
生成した画像が元のデータセットに取って代わることに成功した3つの重要なコンポーネントを特定します。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:33:02 GMT)
Measuring The Impact Of Programming Language Distribution [29.0] 我々は,任意の言語におけるベンチマークの実行ベースの評価を行うためのBabelCodeフレームワークを提案する。
我々は Translating Python Programming Puzzles (TP3) と呼ばれる新しいコード翻訳データセットを提案する。
トレーニングデータセットにおける14の言語分布のバランスをとることで,低リソース言語における大規模言語モデルの性能が向上するかどうかを検討する。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:20:33 GMT)
Ranking with Popularity Bias: User Welfare under Self-Amplification
Dynamics [28.9] 本稿では,アイテムの人気度,品質,位置バイアスがユーザの選択に影響を及ぼす一般的なメカニズムを提案する。
また, 線形設定においても, 人気バイアスの影響により, 商品品質の識別が不可能になることが示唆された。
論文参考訳(メタデータ) (Wed, 24 May 2023 22:38:19 GMT)
ImageNetVC: Zero-Shot Visual Commonsense Evaluation on 1000 ImageNet
Categories [28.9] ゼロショットビジュアル・コモンセンス評価のための細粒度人間アノテーション付きデータセットであるImageNetVCを提案する。
単調なPLMとVaLMの両方の基本的な視覚的常識知識を探求し、スケーリング法則とVaLMに対するバックボーンモデルの影響を明らかにする。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:14:31 GMT)
You Are What You Annotate: Towards Better Models through Annotator
Representations [28.7] アノテーション(アノテーションの埋め込み)とアノテーション(アノテーションの埋め込み)を、それぞれに関連付けられた学習可能な行列で表現します。
提案手法は,1%未満のモデルパラメータを追加することにより,様々なNLPベンチマークにおけるモデル性能を著しく向上させる。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:06:13 GMT)
Towards Revealing the Mystery behind Chain of Thought: a Theoretical
Perspective [28.5] CoT(Chain-of-Thought prompting)は,大規模言語モデル(LLM)の性能を劇的に向上させる
我々は、CoT を用いた LLM が、動的プログラミング(Dynamic Programming)として知られる、一般的な意思決定問題のクラスを解くことができることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:59:21 GMT)
Complex Mathematical Symbol Definition Structures: A Dataset and Model
for Coordination Resolution in Definition Extraction [27.9] 我々は、全文科学論文から5,927文の英語データセットであるSymDefを提示する。
このデータセットは、特に「ふりかえり」構造のような複雑な協調構造に焦点を当てている。
本稿では,数理記号をマスキングし,各記号に対する各文のコピーを作成し,対象記号を指定し,スロットフィリングを用いて対応する定義の範囲を予測する新しい定義抽出手法を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:53:48 GMT)
OverPrompt: Enhancing ChatGPT Capabilities through an Efficient
In-Context Learning Approach [27.8] 本稿では,複数の入力を並列に処理することで,LLMの効率と性能を向上させるためのコンテキスト内学習手法であるOverPromptを提案する。
さまざまなデータセットで評価され、OverPromptはタスク効率を高め、パフォーマンス改善のためのさまざまなサンプルを統合する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:08:04 GMT)
GAMUS: A Geometry-aware Multi-modal Semantic Segmentation Benchmark for
Remote Sensing Data [27.6] 本稿では,RGB-Height(RGB-H)データに基づくマルチモーダルセマンティックセマンティックセマンティクスのための新しいベンチマークデータセットを提案する。
提案するベンチマークは,1)共登録RGBとnDSMペアと画素単位のセマンティックラベルを含む大規模データセットと,2)リモートセンシングデータに基づく畳み込みとトランスフォーマーベースのネットワークのための既存のマルチモーダル融合戦略の包括的評価と解析からなる。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:03:18 GMT)
Leveraging Future Relationship Reasoning for Vehicle Trajectory
Prediction [27.6] 本稿では,車線情報を用いてエージェント間の将来の関係を予測する手法を提案する。
エージェントの粗い将来の動きを得るため,まず車線レベルのウェイポイント占有確率を予測した。
次に,各エージェントペアに対して隣接車線を通過させる時間的確率を利用して,隣接車線を通過するエージェントが高度に相互作用すると仮定する。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:33:28 GMT)
A Survey of Controllable Text Generation using Transformer-based
Pre-trained Language Models [27.6] 制御可能なテキスト生成(CTG)は、自然言語生成(NLG)分野における新興分野である
本稿では,この領域における共通課題,主なアプローチ,評価手法について,体系的な批判的考察を行う。
我々は、この分野が直面している課題について議論し、様々な将来的な方向性を示した。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:38:10 GMT)
Improving Factuality of Abstractive Summarization without Sacrificing
Summary Quality [27.6] 我々は,要約品質を犠牲にすることなく,要約事実性を改善するためのEFACTSUM(Effective Factual Summarization)を提案する。
比較学習フレームワークを改良した候補サマリーと組み合わせることで,実感と類似度に基づく測定値の両方が大幅に向上することを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:15:17 GMT)
PromptNER: Prompting For Named Entity Recognition [27.5] 本稿では,少数ショットとクロスドメインNERのための最先端アルゴリズムであるPromptNERを紹介する。
PromptNERは、数ショットのNERで最先端のパフォーマンスを実現し、ConLLデータセットでF1スコアの11%(絶対)改善を実現している。
また、利用可能なデータの2%未満を使用しながらも、平均的なF1ゲイン9%の5つのクロスドメインNERターゲットドメインに新しいマークを設定しました。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:38:24 GMT)
Unsupervised Semantic Correspondence Using Stable Diffusion [27.4] 我々は,この意味的知識を拡散モデル内で活用し,意味的対応を見いだせることを示す。
我々はこれらのモデルの迅速な埋め込みを最適化し、関心のある領域に最大限の注意を払う。
我々は、PF-Willow、CUB-200、SPair-71kデータセットにおいて、既存の弱い、または教師なしの手法を著しく上回っている。
論文参考訳(メタデータ) (Wed, 24 May 2023 21:34:34 GMT)
Evaluating NLG Evaluation Metrics: A Measurement Theory Perspective [27.3] NLG評価指標の妥当性と信頼性を概念化し,評価するためのフレームワークとして測定理論を用いる。
我々は有効かつ信頼性の高いメトリクスの設計、評価、解釈を促進することを目指しており、最終的には堅牢で効果的なNLGモデルの進歩に寄与する。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:38:23 GMT)
Flocks of Stochastic Parrots: Differentially Private Prompt Learning for
Large Language Models [27.0] 我々は、大規模言語モデルを促進するために使用されるデータに対して、単純だが非常に効果的なメンバーシップ推論攻撃をインスタンス化する。
当社のプロンプトベースのアプローチは,既存の商用APIで容易にデプロイ可能であることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 22:06:08 GMT)
Learning logic programs by explaining their failures [27.0] 本稿では,帰納論理プログラミングにおける障害説明手法を提案する。
仮説が失敗した場合、サブプログラムの失敗の観点からその失敗を説明する。
きめ細かい故障解析により、仮説空間上のきめ細かい制約を学習できることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:16:53 GMT)
Optimal Rates for Bandit Nonstochastic Control [26.9] 既知システムと未知システムの両方に対して最適な後悔(対数要因まで)を達成できる帯域幅LQRとLQGのアルゴリズムを提案する。
提案手法の中心的な構成要素は,メモリを用いたバンドベックス最適化のための新しい手法であり,これは独立した関心事である。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:02:30 GMT)
Privacy Implications of Retrieval-Based Language Models [26.9] 本稿では,検索に基づくLM,特に$k$NN-LMにおけるプライバシリスクに関する最初の研究について述べる。
パラメトリックモデルよりも、$k$NN-LMsの方がプライベートデータストアから個人情報をリークする可能性が高いことがわかりました。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:37:27 GMT)
Bactrian-X : A Multilingual Replicable Instruction-Following Model with
Low-Rank Adaptation [26.8] Bactrian-Xは52言語にまたがる340万の命令応答対の包括的な多言語並列データセットである。
基本モデルとシームレスに統合された軽量なコンポーネントであるローランク適応(LoRA)を用いて,アダプタセットを訓練する。
提案手法は,バニラモデルと既存の命令調整モデルの両方より優れている。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:50:31 GMT)
Can We Faithfully Represent Masked States to Compute Shapley Values on a
DNN? [26.8] ディープニューラルネットワークの入力変数をマスキングすることは、サンプル内の入力変数の属性を計算する方法を表す。
ベースライン値が入力変数の欠如を忠実に表すかどうかを調べる理論はない。
本研究では,最適基準値の学習法を提案し,その有効性を実証した。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:36:09 GMT)
Dual Path Transformer with Partition Attention [26.7] 本稿では,2重注意という,効率的かつ効果的に機能する新しい注意機構を提案する。
我々は,イメージネットのイメージ分類,COCOのオブジェクト検出,都市景観のセマンティックセグメンテーションなど,複数のコンピュータビジョンタスクにおけるモデルの有効性を評価する。
提案されたDualFormer-XSは、ImageNet上で81.5%のTop-1精度を達成し、最近の最先端のT-XSを0.6%上回り、スループットが大幅に向上した。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:17:53 GMT)
Voices of Her: Analyzing Gender Differences in the AI Publication World [26.7] 我々は、AI分野における78K研究者のAI Scholarデータセットを用いて、いくつかの性別差を同定する。
女性第一著者の論文は、より長い文章、よりポジティブな感情の言葉、よりキャッチーなタイトルなど、異なる言語スタイルを示している。
私たちの分析は、私たちのAIコミュニティにおける現在の人口統計トレンドの窓口を提供し、将来、より多くの男女平等と多様性を奨励します。
論文参考訳(メタデータ) (Wed, 24 May 2023 00:40:49 GMT)
Towards standardizing Korean Grammatical Error Correction: Datasets and
Annotation [26.5] 韓国の文法的誤りを幅広くカバーするデータセットを提供する。
次に韓国語で14のエラータイプを定義し、並列コーパスから自動アノテート可能なKAGASを提供する。
我々のデータセットでトレーニングしたモデルは、より広い範囲のエラータイプにおいて、現在使われている統計的韓国のGECシステム(Hanspell)よりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:46:52 GMT)
This Land is {Your, My} Land: Evaluating Geopolitical Biases in Language
Models [26.5] 地政学的バイアスの概念は、言語的文脈によって異なる地政学的知識を報告する傾向にある。
例えば、広く争われているスプラトリー諸島については、中国に質問された場合、中国に質問された場合、タガログに質問された場合、フィリピンに回答した場合には、LMは中国に属すと言う可能性が高いだろうか。
論文参考訳(メタデータ) (Wed, 24 May 2023 01:16:17 GMT)
Measuring the Knowledge Acquisition-Utilization Gap in Pretrained
Language Models [26.3] 事前訓練された言語モデル(PLM)は、膨大な量の知識を取得する証拠を示している。
このパラメトリックな知識が、下流のタスクの実行に実際にどの程度使えるかは、まだ不明である。
PLMにおけるパラメトリック知識利用量を測定するための体系的枠組みを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:26:11 GMT)
NESTER: An Adaptive Neurosymbolic Method for Treatment Effect Estimation [25.9] 我々はニューロシンボリック処理効果推定器(NESTER)という適応手法を提案する。
NESTERは、治療効果推定のためのマルチヘッドニューラルネットワークに基づく既存の手法で使用されているアイデアを1つのフレームワークにまとめる。
我々の総合的な実験結果から、NESTERはベンチマークデータセットの最先端手法よりも優れた性能を示している。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:33:54 GMT)
Disentangled Phonetic Representation for Chinese Spelling Correction [25.7] 中国語のspelling Correctionは、中国語のテキスト中の誤字を検出し、訂正することを目的としている。
このタスクに音声情報を導入する試みは行われてきたが、通常は音声表現と文字表現を融合させる。
そこで本稿では,テキスト情報と音声情報の直接的相互作用を可能にするために,2種類の機能を切り離すことを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:39:12 GMT)
Adaptive Data Analysis in a Balanced Adversarial Model [25.5] 適応データ解析において、メカニズムは未知の分布から$n$、すなわち$D$のサンプルを取得し、正確な推定を行う必要がある。
我々は、それぞれが2つの分離されたアルゴリズムから構成されるアンフバランスドと呼ばれる、より制限された敵を考える。
これらの強い硬さの仮定は、計算的に有界なアンフバランス逆元が公開鍵暗号の存在を示唆するという意味では避けられないことを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:08:05 GMT)
SmartTrim: Adaptive Tokens and Parameters Pruning for Efficient
Vision-Language Models [25.4] トランスフォーマーベースの事前訓練された視覚言語モデル(VLM)は、長い入力と多くのパラメータから生じる効率の問題に悩まされている。
本稿では,VLMにおけるSmartTrimを適応的に高速化する手法を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:18:00 GMT)
Anchor Prediction: Automatic Refinement of Internet Links [25.3] 本稿では,アンカー予測の課題を紹介する。
目標は、リンクされたターゲットWebページの特定の部分を特定することであり、ソースリンクのコンテキストに最も関係している。
AuthorAnchorsデータセットは、自然にアンカーされたリンクの34Kのコレクションです。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:12:33 GMT)
Text Conditional Alt-Text Generation for Twitter Images [25.3] 本稿では,ソーシャルメディア,特にTwitterで共有された画像のアルトテキスト記述を生成するアプローチを提案する。
Twitterに投稿された画像には、便利なコンテキストを提供するユーザ記述のテキストが添付されることが多い。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:35:26 GMT)
SELFOOD: Self-Supervised Out-Of-Distribution Detection via Learning to
Rank [25.3] SELFOOD は自己監督型 OOD 検出法であり, 自己管理型 OOD 検出法である。
本手法は粗い設定ときめ細かい設定の両方に有効であることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:01:27 GMT)
The Decades Progress on Code-Switching Research in NLP: A Systematic
Survey on Trends and Challenges [25.1] テキストと会話の共通する現象であるコードスイッチングは、自然言語処理(NLP)研究コミュニティによって何十年にもわたって研究されてきた。
我々は,過去数十年の進歩を理解するために,自然言語処理におけるコードスイッチング研究に関する総合的な体系的調査を紹介する。
論文参考訳(メタデータ) (Wed, 24 May 2023 19:07:20 GMT)
OpenPI2.0: An Improved Dataset for Entity Tracking in Texts [25.0] 手続きテキスト中のエンティティ状態を追跡するための改良されたデータセットであるOpenPI2.0を提案する。
OpenPI2.0は、評価を促進する標準的なエンティティだけでなく、手動ラベルと自動予測を含むサリエンスアノテーションも備えている。
論文参考訳(メタデータ) (Wed, 24 May 2023 00:57:35 GMT)
Sliced-Wasserstein on Symmetric Positive Definite Matrices for M/EEG
Signals [24.8] 共分散行列の分布を扱うための新しい手法を提案する。
本稿では,脳コンピュータインタフェースの領域適応におけるワッサースタイン距離の効率的なサロゲートであることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:48:35 GMT)
Fourier Transformer: Fast Long Range Modeling by Removing Sequence
Redundancy with FFT Operator [24.7] フーリエ変換器は、様々な大きな事前訓練されたモデルから継承する能力を維持しながら、計算コストを大幅に削減することができる。
本モデルは,長距離モデリングベンチマークLRAにおいて,トランスフォーマーベースモデル間の最先端性能を実現する。
CNN/DailyMailやELI5などのシークエンシャルなシークエンスタスクでは、BARTを継承することで、私たちのモデルは標準のBARTよりも優れています。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:33:06 GMT)
Gorilla: Large Language Model Connected with Massive APIs [24.7] APIコールの記述において,GorillaはGPT-4の性能を上回る微調整のLLaMAモデルである。
モデルの能力を評価するために、HuggingFace、TorchHub、APIHubで構成される包括的なデータセットであるAPIBenchを紹介します。
検索システムとゴリラの統合が成功したことは、LLMがより正確にツールを使用する可能性を示している。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:48:11 GMT)
Leaving Reality to Imagination: Robust Classification via Generated
Datasets [24.4] 近年のロバスト性に関する研究では、テストセットと同様のデータセットでトレーニングされたニューラルイメージ分類器間での顕著なパフォーマンスギャップが明らかになった。
生成したデータセットは、画像分類器の自然な堅牢性にどのように影響するのか?
生成したデータで強化された実データに基づいて訓練された画像ネット分類器は、標準トレーニングよりも精度が高く、効果的に頑健であることがわかった。
論文参考訳(メタデータ) (Wed, 24 May 2023 01:39:41 GMT)
1-D Residual Convolutional Neural Network coupled with Data Augmentation
and Regularization for the ICPHM 2023 Data Challenge [24.4] 本稿では,生の3チャンネル時間領域振動信号を用いた残差畳み込みニューラルネットワークを提案する。
ネットワークは、検査中のギアボックスの状態を正確に予測することができる。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:11:20 GMT)
Measuring Faithful and Plausible Visual Grounding in VQA [24.3] VQA(Visual Question Answering)システムにおける視覚的グラウンドリング(VG)のメトリクスは、与えられた質問に対する回答を推測する際に、システムの画像の関連部分への依存度を測定することを目的としている。
VGの欠如は、最先端のVQAシステムに共通する問題であり、無関係な画像部品に過度に依存したり、視覚的モダリティを完全に無視したりすることができる。
本稿では,モデルa)がシーン内の質問関連オブジェクトを識別し,b)応答を生成する際の関連オブジェクトに含まれる情報に実際に依存しているかどうかを判断する新しいVGメトリクスを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:58:02 GMT)
Can Copyright be Reduced to Privacy? [24.3] プライバシーと著作権の間には、見落としてはいけない根本的な違いがある、と我々は主張する。
アルゴリズムの安定性が著作権侵害の標準として採用されれば、著作権法を意図した目的を損なう可能性がある。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:22:41 GMT)
Task-aware Distributed Source Coding under Dynamic Bandwidth [24.3] 独立エンコーダとジョイントデコーダからなる分散圧縮フレームワークを提案し,ニューラル分散主成分分析(NDPCA)と呼ぶ。
NDPCAは、複数のソースからのデータを単一のモデルで任意の帯域に柔軟に圧縮し、計算とストレージのオーバーヘッドを減らす。
実験の結果,NDPCAは多視点ロボットアーム操作の成功率を9%向上し,衛星画像上の物体検出タスクの精度を14%向上させることがわかった。
論文参考訳(メタデータ) (Wed, 24 May 2023 19:20:59 GMT)
SETI: Systematicity Evaluation of Textual Inference [24.2] 本稿では,事前学習言語モデル(PLM)を評価するための新しい総合ベンチマークSETI(Systematicity Evaluation of Textual Inference)を提案する。
特に、SETIは3つの異なるNLIタスクとそれに対応するデータセットを提供し、推論プロセスにおける様々なタイプの体系性を評価する。
実験の結果,プリミティブを組み合わさった知識に遭遇したとき,多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種多種
論文参考訳(メタデータ) (Wed, 24 May 2023 11:35:31 GMT)
Anthropomorphization of AI: Opportunities and Risks [24.1] 擬人化は、人間的な特徴を非人間的な実体に当てはめる傾向である。
AIシステムが広く採用されるにつれて、ユーザーがそれを人為的に形作る傾向は著しく高まっている。
我々は、近年のAI権利章典の青写真を通して分析された、客観的な法的意味について研究する。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:39:45 GMT)
Self-Checker: Plug-and-Play Modules for Fact-Checking with Large
Language Models [24.1] Self-Checkerはファクトチェックを容易にするプラグインとプレイモジュールからなるフレームワークである。
このフレームワークは、低リソース環境でファクトチェックシステムを構築するための、高速で効率的な方法を提供する。
論文参考訳(メタデータ) (Wed, 24 May 2023 01:46:07 GMT)
Incremental Dense Reconstruction from Monocular Video with Guided Sparse
Feature Volume Fusion [24.0] 本報告では, TSDF値のリアルタイムな特徴量に基づく高密度再構成手法を提案し, 新たな深部特徴量からTSDF値を推定する。
不確実性を認識したマルチビューステレオネットワークを利用して、スパース特徴量における物理表面の初期ボクセル位置を推定する。
提案手法は,多くの場合において,より細部でより完全な再構築が可能であることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:06:01 GMT)
Large Language Models are Better Reasoners with Self-Verification [23.9] 思考の連鎖(CoT)はいくつかの自然言語処理タスクにおいて強い推論能力を示している。
大規模言語モデル (LLM) も同様な自己検証能力を持つことを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:34:20 GMT)
Adversarial Demonstration Attacks on Large Language Models [23.6] 本稿では,テキスト内学習(ICL)のセキュリティ問題について,敵対的観点から検討する。
提案手法は,入力を変更せずに実演のみを操作することを目的として,TextAttackに基づくICL攻撃を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:40:56 GMT)
Chain-of-Questions Training with Latent Answers for Robust Multistep
Question Answering [23.6] Chain-of-Questionsは、モデルをトレーニングしてサブクエストを生成し、サブアンサーを一度に生成するフレームワークである。
我々はサブアンサーを潜伏変数として扱い、Hard-EMとMAPOの動的混合を用いてそれらを最適化する。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:55:08 GMT)
Mixture of Experts with Uncertainty Voting for Imbalanced Deep
Regression Problems [23.5] 我々は、レグレッション・セッティングにMix-of-expertアプローチを適用する。
このアプローチを使用する際の大きな疑問は、複数の専門家からの予測をひとつのアウトプットに融合させる方法だ。
提案手法はMOUVと呼ばれ,各専門家が出力値だけでなく,その不確実性も予測する。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:12:21 GMT)
EgoVSR: Towards High-Quality Egocentric Video Super-Resolution [23.5] EgoVSRは、エゴセントリックビデオ用に特別に設計されたビデオ超解法フレームワークである。
我々は、VSRフレームワークのDual Branch Deblur Network (DB$2$Net) を用いて、エゴセントリックなビデオにおける動きのぼかしに取り組む。
一般的なVSRトレーニングデータに対するオンラインモーションブラー合成モデルを提案し,エゴセントリックビデオのような動きブラーをシミュレートした。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:25:51 GMT)
Learning Antidote Data to Individual Unfairness [23.1] 個人の公平さは、個々のケースに対する公平な扱いを記述する上で不可欠な概念である。
従来の研究では、個人的公正性は予測不変問題として特徴づけられていた。
我々は,予測ユーティリティの最小あるいはゼロのコストで,個人の不公平さを抑える方法を示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:56:59 GMT)
A Simple and Effective Framework for Strict Zero-Shot Hierarchical
Classification [23.1] 大規模言語モデル(LLM)は、特にゼロまたは少数ショット設定において、ベンチマークタスクで強力なパフォーマンスを達成した。
階層的なデータセットに対して,より示唆的なロングテール予測タスクを提案する。
本手法は,リソース集約的なプロセスである更新を一切必要とせず,複数のデータセットにまたがる高いパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:04:26 GMT)
How To Control Text Simplification? An Empirical Study of Control Tokens
for Meaning Preserving Controlled Simplification [23.0] 本研究では,異なる制御機構がモデル出力の妥当性と簡易性に与える影響について検討する。
本稿では,文レベルでの制御トークンの予測方法を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:29:45 GMT)
Improving Probability-based Prompt Selection Through Unified Evaluation
and Analysis [22.9] 本稿では,既存の確率ベースプロンプト選択手法を解釈し,評価する統合フレームワークを提案する。
我々はいくつかのMIの変種を開発し、最良のプロンプト選択法の有効性を87.79%から94.98%に向上させた。
本稿では,既存の手法の勾配であるCBM(Marginalization)と呼ばれる新しいキャリブレーション手法を提案し,最適手法の迅速な選択効率を99.44%向上させる。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:29:50 GMT)
ChatFace: Chat-Guided Real Face Editing via Diffusion Latent Space
Manipulation [22.7] そこで本研究では,テキスト駆動による画像編集をセマンティック潜時空間の拡散モデルで行う手法を提案する。
拡散モデルの時間的特徴を生成過程における意味条件と整合させることにより,安定な操作戦略を導入する。
我々はChatFaceという対話型システムを開発し、大きな言語モデルのゼロショット推論能力を組み合わせて効率的な操作を行う。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:28:37 GMT)
Breaking the Curse of Quality Saturation with User-Centric Ranking [22.5] 検索、広告、レコメンデーションにおける重要なパズルは、ランキングモデルが利用可能なユーザーインタラクションデータのごく一部しか利用できないことである。
この定式化は有望なスケーリング特性を持ち、より大規模なデータセット上でより優れた収束モデルをトレーニングできることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:45:38 GMT)
Injecting Knowledge into Biomedical Pre-trained Models via Polymorphism
and Synonymous Substitution [22.5] 事前学習言語モデル(PLM)は、トレーニングデータに存在する関係知識を格納できると考えられていた。
PLMの低周波リレーショナル知識は、高周波リレーショナル知識と比較して過度に表現される。
PLMにリレーショナル知識を注入する,単純かつ効果的な手法を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:48:53 GMT)
Towards Few-shot Entity Recognition in Document Images: A Graph Neural
Network Approach Robust to Image Manipulation [22.4] トークン間のトポロジ的隣接関係を導入し、相対的な位置情報を強調する。
言語モデル埋め込みの上にグラフニューラルネットワーク層を追加することにより、これらのグラフを事前訓練された言語モデルに組み込む。
2つのベンチマークデータセットの実験によると、LAGERは異なる数ショット設定で強いベースラインを著しく上回っている。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:34:33 GMT)
First- and Second-Order Bounds for Adversarial Linear Contextual Bandits [22.4] 我々は,K$の腕に付随する損失関数を制限なく時間とともに変化させることができる,逆線形文脈帯域設定を考える。
V_T$ または $L_T*$ は$T$ よりもかなり小さい可能性があるため、環境が比較的良心的であれば、最悪の場合の後悔よりも改善される。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:27:03 GMT)
Large Language Model Distillation Doesn't Need a Teacher [22.3] 大規模言語モデルに対する教師なしタスク非依存蒸留法を提案する。
提案手法は,13のゼロショットエンドタスクにおいて,バニラ蒸留法とパープレキシティと精度を一致または比較することにより,モデルサイズを50%削減することができる。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:18:35 GMT)
Debias Coarsely, Sample Conditionally: Statistical Downscaling through
Optimal Transport and Probabilistic Diffusion Models [22.3] 非ペアデータ間の統計的ダウンスケーリングのための2段階確率的フレームワークを提案する。
本研究では, 1次元および2次元流体問題に対する提案手法の有用性を実証する。
論文参考訳(メタデータ) (Wed, 24 May 2023 23:40:23 GMT)
AMELI: Enhancing Multimodal Entity Linking with Fine-Grained Attributes [22.2] 本稿では属性認識型マルチモーダル・エンティティリンクを提案する。
目標は、マルチモーダルな知識ベースから対応する対象エンティティを予測することである。
本研究を支援するために,18,472のレビューと35,598の製品からなる大規模データセットAMELIを構築した。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:01:48 GMT)
Instruction Tuning with Lexicons for Zero-Shot Style Classification [21.9] 学習中に目に見えない新しいスタイルを識別する方法を言語モデルに教える手段として,スタイルレキシコンの有効性について検討する。
本研究では,レキシコンをベースとした命令により,転送ゼロショット性能が大幅に向上したことを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 00:17:36 GMT)
LMs with a Voice: Spoken Language Modeling beyond Speech Tokens [21.9] SPECTRONは、事前訓練された言語モデル(LM)を用いて音声継続を行うための新しいアプローチである。
事前学習した音声エンコーダを利用することで、本モデルはテキストと音声の両方の出力を生成し、システム全体がスペクトル上で直接操作するエンドツーエンドの訓練を行う。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:39:43 GMT)
Differentially Private Synthetic Data via Foundation Model APIs 1:
Images [21.9] この問題を解決するために,PE(Private Evolution)と呼ばれる新しいフレームワークを提案する。
PEは、モデルトレーニングなしで、最先端のSOTA(State-of-the-art)メソッドにマッチしたり、性能を上回ります。
論文参考訳(メタデータ) (Wed, 24 May 2023 23:47:26 GMT)
Trade-Offs Between Fairness and Privacy in Language Modeling [21.9] 既存の研究では、プライバシーの保護は分類タスクにおけるバイアスの悪化の価格に関係していることが示唆されている。
プライバシ保護とデバイアス技術の両方をテキスト生成モデルのトレーニングに組み込むことで、このトレードオフが本当に保持する範囲について検討する。
バイアス検出、プライバシ攻撃、言語モデリング、下流タスクのパフォーマンスなど、幅広い実験を行います。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:18:28 GMT)
Reversible Graph Neural Network-based Reaction Distribution Learning for
Multiple Appropriate Facial Reactions Generation [21.8] 本稿では,最初の複数顔反応生成フレームワークを提案する。
顔の反応生成問題を1対1のマッピング問題として再定式化する。
実験の結果,提案手法は既存のモデルよりも,より適切で現実的で,同期的な顔反応を生成できることがわかった。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:56:26 GMT)
CLIP-Sculptor: Zero-Shot Generation of High-Fidelity and Diverse Shapes
from Natural Language [21.7] CLIP-Sculptorは、トレーニング中に(テキスト、形状)ペアを必要とせずに、高忠実で多様な3次元形状を生成する方法である。
形状の多様性を向上させるために、CLIPのイメージテキスト埋め込み空間に条件付きトランスフォーマーを用いてモデル化した離散潜在空間を用いる。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:04:20 GMT)
Evaluate What You Can't Evaluate: Unassessable Generated Responses
Quality [21.7] 大規模な言語モデルに基づく参照不要評価器の使用には課題がある。
参照なし評価器は、異なるセマンティクス応答を持つオープンな例により適している。
対話応答の質を評価するため, LLM に基づく推論不要評価器の使用にはリスクがある。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:52:48 GMT)
Parallel Spiking Neurons with High Efficiency and Ability to Learn
Long-term Dependencies [21.6] スパイキングニューラルネットワーク(SNN)は、チャージ・ファイア・リセット・ニューラル・ダイナミクスを使用する。
本稿では,前者とは独立に隠れた状態を生成するParallel Spiking Neuron (PSN)を提案する。
我々はPSNファミリーをシミュレーション速度と時間的・静的データ分類で評価し,PSNファミリーの効率と精度において圧倒的な優位性を示した。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:07:03 GMT)
DynStatF: An Efficient Feature Fusion Strategy for LiDAR 3D Object
Detection [21.6] 複数の前のフレームでLiDAR入力を拡張することで、よりリッチなセマンティック情報が得られる。
複数フレームのクラウド化された点雲は、動きのぼやけや不正確な点投影による正確な位置情報を損なう可能性がある。
マルチフレームで提供されるリッチなセマンティック情報を強化する機能融合戦略DynStaFを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:00:01 GMT)
Psychologically-Inspired, Unsupervised Inference of Perceptual Groups of
GUI Widgets from GUI Images [21.5] 本稿では,GUIウィジェットの知覚群を推定するための教師なし画像ベース手法を提案する。
772個のモバイルアプリと20個のUIデザインモックアップから収集した1,091個のGUIのデータセットによる評価は、我々の手法が最先端のアドホックベースのベースラインを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Wed, 24 May 2023 01:18:23 GMT)
Introducing Competition to Boost the Transferability of Targeted
Adversarial Examples through Clean Feature Mixup [21.4] 逆の例は、微妙な入力修正によって誤った予測を引き起こす可能性がある。
ディープニューラルネットワークは敵の例に影響を受けやすいため、微妙な入力修正によって誤った予測を引き起こす可能性がある。
提案手法は,対象とする対向例の転送可能性を高めるため,最適化プロセスに競合を導入することを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:54:44 GMT)
Revisiting Parallel Context Windows: A Frustratingly Simple Alternative
and Chain-of-Thought Deterioration [21.4] 最近の並列統合手法であるParallel Context Windows (PCW) の評価における2つの重要な限界を同定する。
まず、簡単なが強いベースライン、重み付けされた和アンサンブルが、文脈内数ショットの分類に欠けていることを示す。
既存のPCW設計では,実世界のアプリケーションにおける長大な文書処理において,十分な改善と実用性は保証されない可能性が示唆された。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:48:29 GMT)
The Behavior and Convergence of Local Bayesian Optimization [21.3] 局所最適化戦略は、従来のグローバル戦略と比較して高次元問題に対して強い経験的性能をもたらすことができる。
まず,局所的なアプローチの挙動を考察し,ガウス過程のサンプルパスの個々の局所解の統計値が,グローバルな手法から得られるであろうものと比較して驚くほど良好であることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 21:11:49 GMT)
FedGCN: Convergence and Communication Tradeoffs in Federated Training of
Graph Convolutional Networks [21.2] 我々は、フェデレートグラフ畳み込みネットワーク(FedGCN)アルゴリズムを導入し、フェデレーション学習を用いて、高速収束と通信の少ない半教師付きノード分類のためのGCNモデルを訓練する。
我々は、FedGCNの収束率と異なるデータ分布下での通信コストのトレードオフを理論的に分析する。
実験の結果,FedGCNアルゴリズムは平均収束率51.7%,通信速度100倍の精度でモデル精度が向上した。
論文参考訳(メタデータ) (Wed, 24 May 2023 19:10:54 GMT)
Jointly Optimizing Image Compression with Low-light Image Enhancement [21.1] 低照度画像強調の協調最適化による新しい画像圧縮フレームワークを提案する。
計算コストを低減したエンドツーエンドのトレーニング可能な2分岐アーキテクチャを設計する。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:14:40 GMT)
Do language models have coherent mental models of everyday things? [20.9] 毎日の物事を"卵"のように考えるとき、彼らは通常、彼らに関連する精神的なイメージを持っています。
言語モデルにはこのような日常のコヒーレントなイメージがありますか?
GPT-3 や Macaw のような最先端の事前学習言語モデル (LM) には,これらのエンティティに関する知識が断片化している。
日常の心的モデルにおいて,より一貫性のある,正確な部分を生成するために,これらのLMに対する簡単な拡張を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 20:40:18 GMT)
Data Curation Alone Can Stabilize In-context Learning [20.9] In-context Learning (ICL) は、大規模な言語モデルに対して、一連のトレーニング例でそれらを促すことで、新しいタスクを実行することを可能にする。
トレーニングセットからランダムにサンプルをサンプリングすると、パフォーマンスのばらつきが高くなります。
トレーニングデータのサブセットを慎重にキュレートすることは、ICLアルゴリズムに他の変更を加えることなく、ICLのパフォーマンスを大幅に安定化させることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 22:32:56 GMT)
The Role of Output Vocabulary in T2T LMs for SPARQL Semantic Parsing [20.7] 我々は、SPARQLセマンティック解析のタスクにおいて、テキスト・トゥ・テキスト(T2T)モデルにおける出力語彙の役割を分析する。
クエリに対して慎重に選択された語彙置換を行い、GrailQAデータセットの17%の範囲で絶対的なゲインを求める。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:55:04 GMT)
Testing the General Deductive Reasoning Capacity of Large Language
Models Using OOD Examples [20.5] 大型言語モデル(LLM)は、チェーン・オブ・シークレットのプロンプトを与えられた抽象的推論能力を持つ。
我々は、幅広い推論規則を検証し、より単純な実演からより複雑な証明に一般化する能力を測定する。
様々な大きさのLLMと訓練目的の4つの実験により、より長く構成的な証明に一般化できることが示されている。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:55:51 GMT)
Graphy Analysis Using a GPU-based Parallel Algorithm: Quantum Clustering [20.5] 本稿では、グラフ構造に量子クラスタリングを適用する新しい方法を紹介する。
量子クラスタリング(Quantum Clustering, QC)は、ポテンシャル関数を構築してクラスター中心を決定する、新しい密度に基づく教師なし学習手法である。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:22:00 GMT)
Enabling Large Language Models to Generate Text with Citations [20.4] 大規模言語モデル (LLM) は情報検索のツールとして広く利用されているが、その生成した出力は幻覚の傾向にある。
我々は,LLMが引用文を生成できるようにし,その事実の正しさと妥当性を向上させることを目的としている。
既存の作業は主に商用検索エンジンと人的評価に依存しており、異なるモデリング手法を再現し比較することは困難である。
論文参考訳(メタデータ) (Wed, 24 May 2023 01:53:49 GMT)
Stochastic Mirror Descent: Convergence Analysis and Adaptive Variants
via the Mirror Stochastic Polyak Stepsize [20.4] 比較的滑らかで滑らかな凸最適化の下でのミラー降下(SMD)の収束について検討した。
我々は、新しい適応的なステップサイズスキーム、ミラーポリアクステップサイズ(mSPS)を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 21:02:59 GMT)
Detecting Check-Worthy Claims in Political Debates, Speeches, and
Interviews Using Audio Data [20.4] 付加的な情報源としての音声信号の有用性について検討する。
我々は48時間音声を含む新しいマルチモーダルデータセット(テキストと音声)を作成する。
評価の結果,複数話者の場合,音声のモダリティはテキストのみよりも向上することがわかった。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:09:42 GMT)
Understanding Label Bias in Single Positive Multi-Label Learning [20.1] 画像ごとの正のラベルを1つだけ使い、効果的なマルチラベルを訓練することができる。
SPMLの標準ベンチマークは、従来のマルチラベル分類データセットに由来する。
本研究では,SPMLにおけるラベルバイアス研究のプロトコルを導入し,新たな実験結果を提供する。
論文参考訳(メタデータ) (Wed, 24 May 2023 21:41:08 GMT)
Free Lunch for Efficient Textual Commonsense Integration in Language
Models [20.0] 類似したコモンセンス記述を持つサンプルを1つのバッチにグループ化し、複数のサンプル間でエンコードされた記述を再利用する。
大規模な実験では、提案したバッチ分割手法が性能を保ちながら計算コストを効果的に削減することを示した。
効率の改善は、大規模なデータセットや、メモリ容量の大きいデバイスでより顕著であり、大規模なアプリケーションに実用性があることを証明している。
論文参考訳(メタデータ) (Wed, 24 May 2023 19:14:57 GMT)
Exploring Automatically Perturbed Natural Language Explanations in
Relation Extraction [20.0] 帰納的バイアスの低下による劣化した説明は、元の説明に比べ、競争力や優れた性能を達成できることがわかった。
我々の発見は、自然言語の説明の特徴に関する新しい知見をもたらした。
論文参考訳(メタデータ) (Wed, 24 May 2023 19:17:13 GMT)
Analyzing Influential Factors in Human Preference Judgments via GPT-4 [20.0] 我々はOpenAIがリリースした対人的判断のデータセットを詳細に検討する。
人間の判断に影響を及ぼす可能性のある重要な要因を特定します。
我々の研究は、人間の判断に埋め込まれた本質的な嗜好を明らかにする。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:13:15 GMT)
Towards Leaving No Indic Language Behind: Building Monolingual Corpora,
Benchmark and Models for Indic Languages [19.9] 3つの重要な軸に沿ってコントリビューションを行うことで、Indic言語のNLU機能を改善することを目指している。
具体的には、4つの言語ファミリーの24言語をカバーする20.9Bトークンで、最大のモノリンガルコーパスであるIndicCorpをキュレートする。
我々は、20言語をカバーする9つの異なるNLUタスクからなる人間によるベンチマークIndicXTREMEを作成する。
言語やタスク全体にわたって、IndicXTREMEには合計105の評価セットが含まれており、そのうち52が新たな文献への貢献である。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:05:16 GMT)
Benchmarking Arabic AI with Large Language Models [19.9] 本研究は、標準アラビアNLPおよび音声処理におけるFMの性能を評価することによる継続的な研究に寄与する。
GPT-3.5-turbo、Whisper、USMを使ったゼロショット学習から始まり、59の公開データセットを使用してユニークなタスクに対処します。
いくつかのタスクでは、FMはSOTAモデルと同等かそれ以上の性能を持つが、大多数では性能が劣る。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:16:16 GMT)
Learning Rate Free Bayesian Inference in Constrained Domains [19.9] 我々は、完全に学習率の低い制約付き領域をサンプリングするための新しい粒子ベースのアルゴリズム群を紹介する。
我々は,本アルゴリズムの性能を,単純度に基づくターゲットからのサンプリングを含む,様々な数値的な例で示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:31:18 GMT)
Reasoning with Language Model is Planning with World Model [19.8] 大規模言語モデル(LLM)は、顕著な推論能力を示している。
LLMには、世界を予測するための$textitworldモデルがない。
我々は新しいLCM推論フレームワークである$underlineRtextiteasoning viunderlinea underlinePtextitlanning$ $textbf(RAP)$を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:28:28 GMT)
Full Resolution Repetition Counting [19.7] トリミングされていないビデオが与えられた場合、反復的なアクションカウントは、クラスに依存しないアクションの反復回数を見積もることを目的としている。
ダウンサンプリングは最近の最先端の手法で一般的に使われ、いくつかの繰り返しサンプルを無視する。
本稿では,オフラインの特徴抽出と時間的畳み込みネットワークを組み合わせることで,時間的分解の視点から繰り返しの動作を理解することを試みる。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:52:44 GMT)
Introducing Expertise Logic into Graph Representation Learning from A
Causal Perspective [19.6] 人的知識をGNNモデルに組み込む新しいグラフ表現学習法を提案する。
提案手法は、GNNモデルが人間の専門家が保持する専門知識を取得するだけでなく、データセットからエンドツーエンドの学習を行うことを可能にする。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:22:49 GMT)
Self-ICL: Zero-Shot In-Context Learning with Self-Generated
Demonstrations [19.5] 大規模言語モデル(LM)は、目標とするタスクに適応する優れたコンテキスト内学習(ICL)能力を示した。
ゼロショットICLのためのシンプルなフレームワークであるSelf-ICLを紹介する。
Self-ICLは、ゼロショットとゼロショットチェーンのベースラインを、ヘッド・ツー・ヘッドとオールタスク平均のパフォーマンスで着実に上回っていることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:22:34 GMT)
Exploring Compositional Visual Generation with Latent Classifier
Guidance [19.5] 我々は、潜在表現生成の非線形ナビゲーションを容易にするために、潜時拡散モデルと補助潜時分類器を訓練する。
潜在分類器ガイダンスにより達成された条件付き生成は、トレーニング中の条件付きログ確率の低い境界を確実に最大化することを示す。
遅延分類器誘導に基づくこのパラダイムは、事前学習された生成モデルに非依存であり、実画像と合成画像の逐次的操作と画像生成の両面での競合結果を示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:17:11 GMT)
NiCro: Purely Vision-based, Non-intrusive Cross-Device and
Cross-Platform GUI Testing [19.5] 我々は,非侵入型クロスデバイス・クロスプラットフォームシステムNiCroを提案する。
NiCroは最先端のGUIウィジェット検出器を使用してGUIイメージからウィジェットを検出し、さまざまなデバイスにまたがるウィジェットにマッチする一連の包括的な情報を分析する。
システムレベルでは、NiCroは仮想デバイスファームとロボットアームシステムと対話して、非侵襲的にクロスデバイスでクロスプラットフォームなテストを実行することができる。
論文参考訳(メタデータ) (Wed, 24 May 2023 01:19:05 GMT)
A Unified Characterization of Private Learnability via Graph Theory [19.3] 純粋かつ近似微分プライベート(DP)学習を特徴付ける統一的なフレームワークを提供する。
DP学習性の特徴を特徴づけるグラフ理論次元を同定する。
論文参考訳(メタデータ) (Wed, 24 May 2023 19:42:51 GMT)
Measuring Bias in AI Models: An Statistical Approach Introducing N-Sigma [19.1] 自動意思決定システムにおけるバイアスを測定する統計的アプローチを解析する。
我々は,N-Sigma法に基づく統計的手法を用いて,機械学習モデルのバイアスを測定する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:48:56 GMT)
Large Language Models are Effective Table-to-Text Generators,
Evaluators, and Feedback Providers [19.0] 大きな言語モデル(LLM)は、制御可能なテキスト生成において顕著な能力を示している。
本稿では,テーブル・ツー・テキスト生成タスクにおけるLLMの能力について検討する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:22:30 GMT)
Modeling rapid language learning by distilling Bayesian priors into
artificial neural networks [18.8] 我々は、ベイズモデルの強い帰納バイアスとニューラルネットワークの柔軟な表現を組み合わせたアプローチで、制限された自然主義的データからの学習が可能であることを示す。
得られたシステムは少数の例から形式的な言語パターンを学習することができる。
また、自然言語のコーパスから英語の構文の側面を学ぶこともできる。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:11:59 GMT)
Pre-training Intent-Aware Encoders for Zero- and Few-Shot Intent
Classification [18.7] そこで本研究では,テキストエンコーダの意図的プシュードラベルを用いたコントラスト学習を用いた新しい事前学習手法を提案する。
また、事前学習した意図認識エンコーダ(PIE)についても紹介する。
我々のPIEモデルは,先行訓練文エンコーダよりも最大5.4%,4.0%高い精度を実現している。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:34:32 GMT)
Which Invariance Should We Transfer? A Causal Minimax Learning Approach [18.7] 本稿では、因果的観点からの包括的ミニマックス分析について述べる。
最小の最悪のリスクを持つサブセットを探索する効率的なアルゴリズムを提案する。
本手法の有効性と有効性は, 合成データとアルツハイマー病の診断で実証された。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:05:01 GMT)
Testing Causal Models of Word Meaning in GPT-3 and -4 [18.7] 本稿では HIPE 理論のレンズによる GPT-3 と GPT-4 の語彙表現について検討する。
GPT-3がHIPEによって仮定された因果構造をコードしている証拠は見つからないが、GPT-4がそのような構造をコードしている証拠は見つからない。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:03:23 GMT)
ECHo: Event Causality Inference via Human-centric Reasoning [18.6] 本稿では,視覚・言語的社会的シナリオに基づく事象因果推論の診断データセットであるECHoを紹介する。
我々は、現在のAIシステムの推論能力を評価するために、Chain-of-Thought(CoT)パラダイムと整合した統合フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:21:13 GMT)
Cream: Visually-Situated Natural Language Understanding with Contrastive
Reading Model and Frozen Large Language Models [18.6] Contrastive Reading Model (Cream)は、Large Language Models (LLM)の言語画像理解能力を高めるために設計された、新しいニューラルネットワークである。
私たちのアプローチは、視覚と言語理解のギャップを埋め、より洗練されたドキュメントインテリジェンスアシスタントへの道を開くことを目的としています。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:59:13 GMT)
Prompt Evolution for Generative AI: A Classifier-Guided Approach [18.5] 本稿では, 生成過程の早い進化, 進化的選択圧, 変化を概念化し, より優れた画像を生成する。
進化的アルゴリズムの新たな特徴は、事前学習された生成モデルが暗黙の突然変異操作を与えることである。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:48:18 GMT)
Airborne Sound Analysis for the Detection of Bearing Faults in Railway
Vehicles with Real-World Data [18.4] 本稿では,Mel Frequency Cepstral Coefficients (MFCC) を特徴として紹介する。
実験の結果、MFCCが選択した断層を有する特徴は、トレーニングに含まれていない損傷に対しても確実に検出できることがわかった。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:08:37 GMT)
Robust 3D-aware Object Classification via Discriminative
Render-and-Compare [18.4] 本稿では,最近の研究を基盤として,単一タスクモデルに比較可能な3次元認識型分類アーキテクチャを提案する。
提案手法とフィードフォワードニューラルネットワークを組み合わせることで,レンダリング・アンド・コンパレートアプローチを大規模カテゴリに拡張する方法について述べる。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:20:09 GMT)
How to Distill your BERT: An Empirical Study on the Impact of Weight
Initialisation and Distillation Objectives [18.2] 私たちは、注意伝達が全体的なパフォーマンスに最高のことを示しています。
また,教師層から生徒を初期化する際の層選択の影響についても検討した。
我々は、さらなる研究のために、効率的なトランスフォーマーベースのモデル蒸留フレームワークとしてコードを公開します。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:16:09 GMT)
Improving Label-Deficient Keyword Spotting Through Self-Supervised
Pretraining [18.2] キーワードスポッティング(KWS)モデルは、音声アシスタントなど、様々なシステムに統合されつつある。
KWSモデルは一般的に大量のラベル付きデータに依存しており、それらのアプリケーションはそのようなデータが利用可能な状況に限られる。
自己教師付き学習(SSL)メソッドは、容易に利用可能な未実装データを活用することで、そのような依存を軽減することができる。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:17:31 GMT)
HiTIN: Hierarchy-aware Tree Isomorphism Network for Hierarchical Text
Classification [18.0] 本稿では階層型木同型ネットワーク(HiTIN)を提案する。
我々は3つの一般的なデータセットで実験を行い、その結果、HiTINはより良いテスト性能とメモリ消費を達成できることを示した。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:14:08 GMT)
Optimal Linear Subspace Search: Learning to Construct Fast and
High-Quality Schedulers for Diffusion Models [18.0] 現在、拡散モデルの適用を制限する重要な問題は、非常に遅い生成プロセスである。
最適線形部分空間探索(OLSS)と呼ばれる新しい手法を提案する。
OLSSは、非常に少ないステップで高品質な画像を生成することができる。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:33:30 GMT)
InterviewBot: Real-Time End-to-End Dialogue System to Interview Students
for College Admission [17.6] InterviewBotは会話履歴とカスタマイズされたトピックをコヒーレントな埋め込みスペースに統合する。
7,361件の人間対人間インタビューの音声録音を自動転写し、440件を手作業で微調整・評価する。
InterviewBotは、その回答をインタビューデータと比較することで統計的にテストし、プロのインタビュアーや様々な学生にリアルタイムで対話させることによって動的にテストする。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:57:39 GMT)
Revisiting Sentence Union Generation as a Testbed for Text Consolidation [17.6] 本稿では,テキスト統合能力を評価するために,文結合生成タスクを効果的に適切に定義されたテストベッドとして再考する。
我々は,文連合をクラウドソーシングし,これまでで最大の連合データセットを作成するための,洗練されたアノテーション方法論とツールを提案する。
次に、人間と自動両方の評価を含む、連合生成のための包括的評価プロトコルを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 22:34:01 GMT)
AWESOME: GPU Memory-constrained Long Document Summarization using Memory
Mechanism and Global Salient Content [17.6] 長い文書要約システムは、長文とjargonladenテキストを持つドメインにとって重要である。
AWESOMEは、より長い文書の競争ベースラインよりも情報性、忠実性、一貫性を改善した要約を生成する。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:00:00 GMT)
Causal Discovery from Subsampled Time Series with Proxy Variables [17.3] 本稿では,サブサンプリング時系列から因果構造全体を同定する制約に基づくアルゴリズムを提案する。
我々のアルゴリズムは非パラメトリックであり、完全な因果同定を実現することができる。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:56:53 GMT)
Parameter-Efficient Fine-Tuning for Medical Image Analysis: The Missed
Opportunity [17.3] 我々は総合的な評価を行う。
多様な医用画像解析タスクのためのPEFT(Efficient Fine-Tuning)技術
特定のシナリオでは最大22%の性能向上を示し,医療用テキスト・画像生成におけるPEFTの有効性を示した。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:28:21 GMT)
Collaborative Auto-encoding for Blind Image Quality Assessment [17.1] ブラインド画像品質評価(BIQA)は、重要な現実世界のアプリケーションにおいて難しい問題である。
近年、ディープニューラルネットワーク(DNN)による強力な表現を活用しようとする試みは、主観的な注釈付きデータの欠如によって妨げられている。
本稿では,この基本的な障害を克服する新しいBIQA法を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:45:03 GMT)
Controllable Text Generation via Probability Density Estimation in the
Latent Space [17.0] 本稿では,潜在空間における確率密度推定を用いた新しい制御フレームワークを提案する。
本手法では,非可逆変換関数である正規化フローを用いて,潜在空間の複素分布を先行空間の単純ガウス分布にマッピングする。
単一属性制御と多属性制御の実験により,本手法は属性関連性やテキスト品質の強いベースラインよりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:02:31 GMT)
Contrastive Learning of Sentence Embeddings from Scratch [16.8] 文の埋め込みを合成データで訓練するコントラスト学習フレームワークであるSynCSEを提案する。
具体的には、大規模な言語モデルを用いて、コントラスト学習に必要なデータサンプルを合成する。
SynCSE-partialとSynCSE-scratchの両方が教師なしベースラインを大幅に上回ることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:56:21 GMT)
Pento-DIARef: A Diagnostic Dataset for Learning the Incremental
Algorithm for Referring Expression Generation from Examples [16.7] 本稿では,パズルの視覚領域における診断データセットであるPento-DIARefを紹介する。
視覚検出ステップと対象データ生成スキームによって支持されたモデルが,ほぼ完全なBLEU@1スコアと文の正確性を実現する。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:05:53 GMT)
Fairness in Streaming Submodular Maximization over a Matroid Constraint [16.6] この問題の自然な一般化をマトロイド制約に当てはめる。
ストリーミングアルゴリズムと、効率、品質、公正性のトレードオフを提供する非可視性結果を提供しています。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:10:46 GMT)
Alleviating Exposure Bias in Diffusion Models through Sampling with
Shifted Time Steps [16.6] 拡散確率モデル (DDPM) は高品質な画像の合成において顕著な有効性を示した。
時間シフトサンプリングという推論手法を提案する。
我々のフレームワークは既存のサンプリングアルゴリズムとシームレスに統合できる。
論文参考訳(メタデータ) (Wed, 24 May 2023 21:39:27 GMT)
Decision-Aware Actor-Critic with Function Approximation and Theoretical
Guarantees [16.3] アクター・クリティック(AC)法は強化学習(RL)に広く用いられている
我々は、俳優と批評家を意思決定で訓練するための共同目標を設計する。
簡単なRL問題に対する意思決定対応型アクター批判フレームワークの利点を実証的に実証する。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:34:21 GMT)
Optimizing DDPM Sampling with Shortcut Fine-Tuning [16.1] ショートカットファインチューニング(SFT)は、事前学習した拡散拡散確率モデル(DDPM)の高速サンプリングの課題に対処するための新しいアプローチである。
SFTは、積分確率メートル法(IPM)の直接最小化によるDDPMサンプリング器の微調整を提唱している。
制御の観点から着想を得た新しいアルゴリズム SFT-PG: Shortcut Fine-Tuning with Policy Gradient を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:28:13 GMT)
Detecting disparities in police deployments using dashcam data [16.0] 公共ストリートシーンのダシュカム画像から警察車両を検出することで,警察の展開レベルの格差を定量化できることを示す。
配置レベルが最も高い地区は、最も低い地区の約20倍高い。
我々は、これらの格差が、ポーリング・エクイティと、ポーリング・データに基づいて訓練されたアルゴリズムに与える影響について論じる。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:48:59 GMT)
Measuring and Mitigating Constraint Violations of In-Context Learning
for Utterance-to-API Semantic Parsing [16.0] 本研究では,タスク指向のセマンティック解析における制約違反を計測,解析,緩和する。
SRD(Semantic-Retrieval of Demonstrations)とAPI-Aware Constrained Decoding(API-CD)の2つの緩和戦略について検討する。
実験の結果、これらの戦略は、制約違反の低減と、生成されたAPI呼び出しの品質向上に有効であるが、実装の複雑さとレイテンシを考慮すると、慎重に検討する必要があることがわかった。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:50:36 GMT)
Towards Foundation Models for Relational Databases [Vision Paper] [15.8] 関係表現学習のビジョンは、完全な関係構造から学習できるだけでなく、より大きなデータベースサイズまで拡張できる。
全体として、この方向は、現在テキストや画像でしか利用できないリレーショナルデータベースの基盤モデルに繋がる可能性があると論じる。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:37:35 GMT)
Explaining the Uncertain: Stochastic Shapley Values for Gaussian Process
Models [15.7] 本稿では,GPの完全な解析的共分散構造を利用するガウス過程 (GP) を説明するための新しい手法を提案する。
提案手法は,協調ゲームに拡張されたShapley値の一般的な解概念に基づいて,ランダム変数である説明を行う。
提案手法を用いて生成したGP説明は,Shapley値と類似の公理を満足し,特徴量やデータ観測にまたがるトラクタブルな共分散関数を有する。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:59:03 GMT)
RoMa: Revisiting Robust Losses for Dense Feature Matching [15.7] マルコフ連鎖の観点から、マッチングに対するロバストな損失を再考する。
提案手法は,最先端技術と比較して大幅に改善されている。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:59:04 GMT)
Learning Survival Distribution with Implicit Survival Function [15.6] 強い仮定を伴わない生存分布推定のためのインプシットニューラルネットワーク表現に基づくインプシット生存関数(ISF)を提案する。
実験の結果、ICFは3つの公開データセットで最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:51:29 GMT)
Frugal Prompting for Dialog Models [15.6] 本研究では,大規模言語モデル(LLM)を用いた対話システム構築のための異なるアプローチについて検討する。
即時チューニングの一環として、インストラクション、例題、現在のクエリ、追加のコンテキストを提供する様々な方法を試行する。
この研究は、最適な使用情報密度を持つダイアログ履歴の表現も分析する。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:06:49 GMT)
Robust Sparse Mean Estimation via Incremental Learning [15.5] そこで本研究では, 部分的に破損したサンプルの集合から, k$-sparse平均を推定することを目的とする, 頑健な平均推定問題について検討する。
両課題を適度な条件下で克服する簡易平均推定器を提案する。
私たちのメソッドは、スパーシティレベル$k$に関する事前の知識を必要としない。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:02:28 GMT)
Leveraging GPT-4 for Automatic Translation Post-Editing [15.5] GPT-4は翻訳後編集に適しており、ターゲット言語が英語でなくても意味のある編集が可能である。
我々は、GPT-4に基づく後編集を用いて、WMT-22英語、英語、英語、中国語、ドイツ語のペアで最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:30:05 GMT)
M4: Multi-generator, Multi-domain, and Multi-lingual Black-Box
Machine-Generated Text Detection [15.3] 大規模言語モデル(LLM)は,多様なユーザクエリに対して,流動的な応答を生成する優れた能力を示している。
これはまた、ジャーナリズム、教育、学術的文脈におけるそのようなテキストの潜在的な誤用に関する懸念も生んでいる。
まず、機械生成テキスト検出のためのマルチジェネレータ、マルチドメイン、多言語コーパスである大規模ベンチマークM4を紹介する。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:55:11 GMT)
SWAMP: Sparse Weight Averaging with Multiple Particles for Iterative
Magnitude Pruning [15.1] イテレーティブ・マグニチュード・プルーニング(IMP)は、その単純さにもかかわらず、特に非常にスパースな状況において、最先端のアルゴリズムである。
Sparse Weight Averaging with Multiple Particles (SWAMP)を提案する。これはIMPの簡単な修正であり、2つのIMPソリューションのアンサンブルに匹敵する性能を実現する。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:01:49 GMT)
CMOT: Cross-modal Mixup via Optimal Transport for Speech Translation [15.1] エンドツーエンドの音声翻訳(ST)は、クロスモーダルなタスクである。
既存の手法は、しばしば機械翻訳(MT)から知識を伝達しようとする
本稿では,モダリティギャップを克服するために,最適輸送CMOTを用いたクロスモーダル混成を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:13:48 GMT)
Label-Efficient Learning in Agriculture: A Comprehensive Review [15.1] 著者らは、ラベル効率のよいML/DLメソッドを監督の度合いに応じて整理する原則的な分類法を開発した。
本稿では,これらのラベル効率アルゴリズムを利用した各種農業応用の体系的レビューを紹介する。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:53:20 GMT)
Don't Take This Out of Context! On the Need for Contextual Models and
Evaluations for Stylistic Rewriting [15.0] 本稿では,先行するテクストコンテキストを,スタイリスティックテキストの書き直しと評価段階の両方に統合することを提案する。
我々の実験は、人間が文脈的でないものよりも文脈的書き直しを好むことを示しているが、自動メトリクスはそうではない。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:58:17 GMT)
Deep Exploration for Recommendation Systems [14.9] 我々はレコメンデーションシステムのための深層探査手法を開発した。
特に、逐次決定問題としてレコメンデーションを定式化する。
本実験は高忠実度産業用シミュレータを用いて行った。
論文参考訳(メタデータ) (Wed, 24 May 2023 01:14:52 GMT)
SummIt: Iterative Text Summarization via ChatGPT [14.9] SummItはChatGPTのような大規模言語モデルに基づいた反復的なテキスト要約フレームワークである。
我々のフレームワークは、自己評価とフィードバックによって生成された要約を反復的に洗練することを可能にする。
3つのベンチマーク要約データセット上で,本フレームワークの性能評価を行った。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:40:06 GMT)
Using evolutionary machine learning to characterize and optimize
co-pyrolysis of biomass feedstocks and polymeric wastes [14.9] 共熱分解は、結果の液体燃料の量および品質パラメータを改善するための有望な戦略である。
機械学習(ML)は、既存のデータを活用することで、このような問題に対処する機能を提供する。
本研究は, バイオマス-ポリマー共熱分解プロセスの生成物を定量化するために, 進化的MLアプローチを導入することを目的とする。
論文参考訳(メタデータ) (Wed, 24 May 2023 19:59:21 GMT)
Removing Structured Noise with Diffusion Models [14.8] 拡散モデルによる後方サンプリングの強力なパラダイムは、リッチで構造化されたノイズモデルを含むように拡張可能であることを示す。
構成雑音による様々な逆問題に対して高い性能向上を示し、競争的ベースラインよりも優れた性能を示す。
これにより、非ガウス測度モデルの文脈における逆問題に対する拡散モデリングの新しい機会と関連する実践的応用が開かれる。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:41:46 GMT)
Realistically distributing object placements in synthetic training data
improves the performance of vision-based object detection models [14.5] 合成データの分布を,実データの分布に可能な限り近いものにすることが重要である。
CARLAにおける3次元車両検出モデルの訓練とKITTIによる試験により,物体配置分布の改善による大幅な改善が示された。
論文参考訳(メタデータ) (Wed, 24 May 2023 01:39:41 GMT)
Test like you Train in Implicit Deep Learning [14.5] 暗黙のディープラーニングは、メタラーニングからDeep Equilibrium Networks (DEQs) まで幅広いアプリケーションで最近人気を集めている。
実際には、内部問題の解は反復的な手順で訓練中に近似される。
一般的に信じられているのは、トレーニングで使用するものよりも内部イテレーションの数を増やすことで、パフォーマンスが向上するということだ。
オーバーパラメトリゼーション(overparametrization)が重要な役割を担っていることを実証する。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:30:33 GMT)
Faithful Low-Resource Data-to-Text Generation through Cycle Training [14.4] 近年,構造化データからテキストを生成する手法が大幅に進歩している。
サイクルトレーニングでは、互いに逆転する2つのモデルを使用する。
サイクルトレーニングが完全に教師付きアプローチとほぼ同等のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:44:42 GMT)
The ACL OCL Corpus: advancing Open science in Computational Linguistics [14.4] 我々はACLアンソロジーの学術コーパスを提示し、ACL OCLと命名された計算言語学領域におけるオープン科学研究を支援する。
以前のARC版やAAN版と比較すると、ACL OCLは論理セクション、数字への参照、大きな知識リソース(意味学者)へのリンクを含む構造化フルテキストを含んでいる。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:35:56 GMT)
Minimax estimation of discontinuous optimal transport maps: The
semi-discrete case [14.3] 2つの確率分布、$P$ および $Q$ in $mathbb Rd$ の間の最適輸送写像を推定する問題を考える。
エントロピックな最適輸送に基づく推定器は、次元に依存しないミニマックス最適速度$n-1/2$で収束することを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:24:19 GMT)
Lightweight Learner for Shared Knowledge Lifelong Learning [14.3] Lifelong Learning (LL)では、エージェントは新しい条件やタスクに遭遇しながら継続的に学習する。
現在のLLのほとんどは、タスクをシーケンシャルに学習する単一のエージェントに限られている。指定されたLLマシンは、新しいタスクが学習されると、古いタスクの忘れを緩和するためにデプロイされる。
LLエージェントの分散集団を配置し,それぞれが異なるタスクを逐次学習する共有知識生涯学習(SKILL)課題を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 21:58:19 GMT)
Meta-Learning For Vision-and-Language Cross-lingual Transfer [14.3] 事前訓練されたビゾン言語モデル (PVLM) は、様々なマルチモーダルデータセットにおいて優れた性能を発揮する。
最近の研究は多言語モデルの構築を目的としており、新しい多言語多モーダルデータセットが提案されている。
視覚言語シナリオにおいて,現在のPVLMを新しい言語に迅速に適応させる新しいメタラーニング微調整フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:51:42 GMT)
Large Language Models for User Interest Journeys [14.2] 大規模言語モデル(LLM)は、自然言語の理解と生成において印象的な能力を示している。
本稿は,LLMがユーザ活動を通じて理屈を定め,その興味を,人間と同じようなニュアンスで興味深い方法で表現することができることを論じる。
本稿では,まず関心旅行の個別抽出を行い,抽出した旅をLLMで要約する枠組みを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:40:43 GMT)
Online Ad Allocation with Predictions [14.2] 我々は,マシン学習予測を組み込んだ両問題に対するアルゴリズムを開発し,最悪の場合を超えて性能を向上する。
我々のアルゴリズムは予測なしで最悪ケースのアルゴリズムを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 24 May 2023 23:45:19 GMT)
Vistaar: Diverse Benchmarks and Training Sets for Indian Language ASR [14.2] IndicWhisperはVistaarベンチマークで考慮されたASRシステムを大幅に改善することを示す。
IndicWhisperは59ベンチマーク中39ベンチマークで最低のWERを持ち、平均で4.1 WERである。
すべてのデータセット、コード、モデルをオープンソースにしています。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:46:03 GMT)
Sparse4D v2: Recurrent Temporal Fusion with Sparse Model [14.2] 我々はSparse4Dの強化版を提案し、時間融合モジュールを改善した。
Sparse4Dは、時間的特徴の高度に効率的な変換を可能にし、スパース特徴のフレーム単位での伝達のみでの時間的融合を容易にする。
提案手法であるSparse4Dv2により,スパース認識アルゴリズムの性能が向上し,nuScenes 3D 検出ベンチマークの最先端結果が得られた。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:00:55 GMT)
RAND: Robustness Aware Norm Decay For Quantized Seq2seq Models [14.1] モデル精度を向上させるために,量子化意識トレーニング(QAT)プロセスに対する低複雑性な変更を提案する。
精度が向上し、ノイズベースのQATの他の利点を活用できるようになる。
論文参考訳(メタデータ) (Wed, 24 May 2023 19:45:56 GMT)
An Efficient Multilingual Language Model Compression through Vocabulary
Trimming [14.1] 語彙トリミング (vocabulary-trimming, VT) は、無関係なトークンを語彙から削除することで、多言語LM語彙を対象言語に還元する手法である。
実験の結果,VT は多言語 LM の本来の性能を維持できるが,サイズは小さく抑えられることがわかった。
この手法は、小さなサイズを単言語モデルとして保持することにより、単言語と多言語の世界の両方の長所を維持することができる。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:00:33 GMT)
Have LLMs Advanced Enough? A Challenging Problem Solving Benchmark For
Large Language Models [14.0] 大規模言語モデル(LLM)の問題解決能力を評価するための挑戦的ベンチマークデータセットを提案する。
IIT-Advanced 試験から,450の難解な数学,物理,化学の問題を評価した。
GPTシリーズの評価では、新しいモデルでは性能が向上するが、最高性能はGPT-4であり、自己整合性やChain-of-Thoughtなどの手法を用いても40%未満であることがわかった。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:55:59 GMT)
Regret-Optimal Model-Free Reinforcement Learning for Discounted MDPs
with Short Burn-In Time [13.9] 本稿では,分散削減を利用したモデルフリーアルゴリズムと,実行方針を低速かつ適応的に切り替える新しい手法を提案する。
これは割引設定における最初の後悔の最適モデルフリーアルゴリズムであり、バーンイン時間の短縮によるメリットがある。
論文参考訳(メタデータ) (Wed, 24 May 2023 20:22:43 GMT)
Generating Faithful Synthetic Data with Large Language Models: A Case
Study in Computational Social Science [13.9] 我々は、合成データ生成における広範囲な問題に取り組み、その生成分布は、研究者が関心を持つ実世界のデータ分布とは異なることが多い。
本研究では,合成データの忠実度を高めるための3つの戦略について検討する。
本稿では,特定のタスクに対して高忠実度合成データを生成する方法について提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:27:59 GMT)
Inverse Preference Learning: Preference-based RL without a Reward
Function [13.8] Inverse Preference Learning (IPL) は、オフラインの嗜好データから学習するために特別に設計された。
我々の重要な洞察は、固定されたポリシーに対して、$Q$関数は報酬関数に関する全ての情報をエンコードし、効果的に交換可能であることである。
IPLは、トランスフォーマーベースおよび非マルコフ報酬関数を利用するより複雑なアプローチと比較して、競争性能が向上する。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:14:10 GMT)
Exploiting Correlations Between Contexts and Definitions with Multiple
Definition Modeling [13.6] 単一定義モデリング(SDM)は、異なる文脈と単語の定義間の相関やパターンを適切にモデル化しない。
本稿では,対象単語のすべてのコンテキストと定義をプールする,MDM(Multiple Definition Modeling)と呼ばれる新しいタスクを設計する。
我々は,MDM を事前訓練タスクとして使用することにより,SDM の性能向上を含む MDM の利点を実演し,分析する。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:38:29 GMT)
Sliced Optimal Partial Transport [13.6] 1次元の2つの非負測度間の最適部分輸送問題を計算するための効率的なアルゴリズムを提案する。
種々の数値実験において,スライス OPT 方式の計算と精度の利点を実証した。
論文参考訳(メタデータ) (Wed, 24 May 2023 22:59:24 GMT)
From Interactive to Co-Constructive Task Learning [13.5] インタラクティブなタスク学習に関する現在の提案をレビューし、その主な貢献について論じる。
次に、共同構築の概念について議論し、成人とロボットの相互作用からの研究知見を要約する。
論文参考訳(メタデータ) (Wed, 24 May 2023 19:45:30 GMT)
Large Language Models as Counterfactual Generator: Strengths and
Weaknesses [13.4] 大規模言語モデル(LLM)は、自然言語の理解と生成タスクにおいて顕著な性能を示した。
本研究は,LLMの反実的生成能力と,この能力に影響を与える解析要因について検討することを目的とする。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:44:32 GMT)
Size Generalizability of Graph Neural Networks on Biological Data:
Insights and Practices from the Spectral Perspective [13.3] グラフニューラルネットワーク(GNN)によって学習された知識が,同じ領域の大規模グラフに対して一般化可能であるかを検討する。
正規化ラプラシア/隣接行列の固有値における小グラフと大グラフの間の分布シフトを同定する。
そこで本研究では,学習過程のガイドとして,サイズ非関連な局所構造特徴を用いたモデル非依存戦略(SIA)を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 23:01:14 GMT)
Deep Equivariant Hyperspheres [13.1] 本稿では, 点雲解析における直交変換の下でのnD特徴量同変の学習手法を提案する。
我々の主な貢献は理論であり、幾何変換の下での等分散や不変といった幾何学的深層学習における主要な問題に取り組むことである。
論文参考訳(メタデータ) (Wed, 24 May 2023 23:04:34 GMT)
Better Low-Resource Entity Recognition Through Translation and
Annotation Fusion [12.9] 我々は、低リソースの言語テキストを高リソースの言語に翻訳してアノテーションを提供する、Translation-and-fusionフレームワークを紹介した。
このフレームワークをベースとしたTransFusionは、低リソース言語で堅牢な予測を行うために、高リソース言語からの予測を融合するよう訓練されたモデルである。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:20:10 GMT)
Adaptive Chameleon or Stubborn Sloth: Unraveling the Behavior of Large
Language Models in Knowledge Clashes [12.8] 本稿では,大規模言語モデル(LLM)の知識衝突時の行動に関する包括的かつ制御された最初の調査について述べる。
LLMは, パラメトリックメモリと矛盾しても, 外部の証拠に対して高い受容性を有することが判明した。
一方、LCMは、外部証拠がパラメトリックメモリと整合した情報を含む場合、強い確証バイアスを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:15:46 GMT)
Towards human-compatible autonomous car: A study of non-verbal Turing
test in automated driving with affective transition modelling [12.7] 本研究は、69人の参加者のフィードバックに基づいて、AIドライバーが乗客のための人間ライクな乗車体験を作成できるかどうかを実路シナリオで検証した。
テストでは,人間の乗客がどのように人間性に順応するかを検討した。
その結果、乗客の人間性の記述は、より感情的な移行によって増加することが判明した。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:16:17 GMT)
Do LLMs Understand Social Knowledge? Evaluating the Sociability of Large
Language Models with SocKET Benchmark [12.7] 大規模言語モデル(LLM)は、様々な構文、談話、推論タスクでうまく機能することが示されている。
我々は、社会知識をテストする58のNLPタスクを含む理論駆動型ベンチマーク「SocKET」を導入する。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:21:06 GMT)
Building Transportation Foundation Model via Generative Graph
Transformer [12.7] 本稿では,交通シミュレーションの原理を交通予測に統合した交通基盤モデル(TFM)を提案する。
TFMは、移動系アクターの参加行動と相互作用を捉えるために、グラフ構造と動的グラフ生成アルゴリズムを使用する。
このデータ駆動・モデルフリーシミュレーション手法は、構造的複雑性とモデル精度の観点から、従来のシステムで直面する課題に対処する。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:34:15 GMT)
Clinically Labeled Contrastive Learning for OCT Biomarker Classification [12.6] 本稿では,臨床データから抽出可能なラベルに基づく医用画像のコントラスト学習手法を提案する。
バイオマーカーラベルを使わずに,臨床データを擬似ラベルとして利用することで,この関係を活用できる。
バイオマーカー検出AUROCでは,最大5%の性能向上が見られた。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:51:48 GMT)
Deriving Language Models from Masked Language Models [12.6] Masked Language Model (MLM) は言語上の分布を明確に定義していない。
最近の研究は、それらを生成と得点の目的で暗黙的に扱っている。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:42:45 GMT)
InpaintNeRF360: Text-Guided 3D Inpainting on Unbounded Neural Radiance
Fields [12.6] InpaintNeRF360は、自然言語の指示を3Dシーンのインペイントのためのガイダンスとして利用する統合フレームワークである。
InpaintNeRF360は、複数のオブジェクトを同時に削除したり、テキスト命令に基づいてオブジェクトの外観を変更することができる。
提案手法の有効性を実証し,暗示放射場の編集可能性を高める可能性を示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:22:23 GMT)
DiffBlender: Scalable and Composable Multimodal Text-to-Image Diffusion
Models [12.4] 我々はDiffBlenderと呼ばれるマルチモーダルテキスト・画像拡散モデルを設計し、様々なタイプのモダリティを同時に組み込む。
条件付モダリティのチャネルを多様化させることにより、DiffBlenderは提供された情報を忠実に反映するか、あるいはその欠如により想像的生成を生成する。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:31:20 GMT)
Multi-Level Knowledge Distillation for Out-of-Distribution Detection in
Text [12.4] 自己教師付き表現学習は、アウト・オブ・ディストリビューション(OoD)検出に有用な要素であることが証明されている。
本稿では,両OoD検出手法の相補的特性を解析する。
本稿では,その限界を緩和しつつ,その強度を統合した多段階の知識蒸留手法を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:04:12 GMT)
A Rigorous Link between Deep Ensembles and (Variational) Bayesian
Methods [12.4] ベイズ的,変分的ベイズ的,アンサンブル法の間の数学的に厳密な関係を確立した。
技術的なレベルでは、ワッサーシュタインフローのレンズを通して一般化された変分推論に寄与する。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:13:59 GMT)
Differentially-Private Decision Trees with Probabilistic Robustness to
Data Poisoning [12.3] 決定木は非線形学習問題に適した解釈可能なモデルである。
この目的のための現在の最先端のアルゴリズムは、小さなプライバシー上の利益のために多くのユーティリティを犠牲にしている。
プライバトレーは個人のヒストグラムに基づいて、小さなプライバシー予算を消費しながら、良好な分割を選択する。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:56:18 GMT)
MultiFusion: Fusing Pre-Trained Models for Multi-Lingual, Multi-Modal
Image Generation [12.3] MultiFusionは、複数のモダリティと言語を任意にインターリーブした入力で複雑な概念を表現することができる。
MutliFusionは、事前訓練されたモデルを活用し、それらを結合システムに統合するために調整する。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:22:18 GMT)
Weighted Sampling for Masked Language Modeling [12.3] トークン周波数とトレーニング損失に基づいてトークンをマスキングするための2つの簡易かつ効果的な重み付きサンプリング手法を提案する。
これら2つの戦略をBERTに適用し、重み付きBERT(WSBERT)を得る。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:31:24 GMT)
Another Dead End for Morphological Tags? Perturbed Inputs and Parsing [12.2] 形態的タグは、誤りを犯す単語のみのニューラルを補正する役割を担っていることを示す。
また, 形態的タグが語彙的摂動に対して有意に頑健であれば, 誤りを訂正できることが示唆された。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:11:04 GMT)
Black-Box vs. Gray-Box: A Case Study on Learning Table Tennis Ball
Trajectory Prediction with Spin and Impacts [12.1] 本稿では,テーブル球の軌道フィルタリングと予測手法を提案する。
我々は,ボールの初期条件を推測するダイナミックスモデル,拡張カルマンフィルタ,ニューラルモデルのパラメータをデータを用いて学習する。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:28:22 GMT)
Causal Strategic Classification: A Tale of Two Shifts [11.9] 戦略行動と因果効果が,2つの相補的な分布シフトをいかに生み出すかを示す。
本稿では,この2つの力のバランスと時間とともに学習アルゴリズムを提案し,エンドツーエンドのトレーニングを可能にした。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:54:25 GMT)
Pre-RMSNorm and Pre-CRMSNorm Transformers: Equivalent and Efficient
Pre-LN Transformers [11.9] 本稿では,2つの主流アーキテクチャであるPre-LNとPre-RMSNormを統一する手法を提案する。
Pre-LN変換器のメインブランチにある本質的に冗長な平均情報を除去することで、LayerNormをRMSNormに還元し、高い効率を実現することができる。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:08:26 GMT)
PathAsst: Redefining Pathology through Generative Foundation AI
Assistant for Pathology [11.7] PathAsstは、病理学における診断と予測分析に革命をもたらすための、生成ファンデーションAIアシスタントである。
我々は、PubMed、総合的な病理教科書、信頼できる病理ウェブサイト、病理学者による注釈付き個人データなど、様々な信頼できる情報源から、142万以上の高品質な病理画像テキストペアを収集した。
私たちのPathAsstは、CLIPビジョンエンコーダと協調して、Vicuna-13B言語モデルに基づいて訓練されています。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:55:50 GMT)
Comparing Humans and Models on a Similar Scale: Towards Cognitive Gender
Bias Evaluation in Coreference Resolution [11.7] モデルバイアスが人間の行動を反映する程度を定量化できますか?
我々は,2つのクラウドソーシング実験から,男女差の偏差をコアパラメータ分解で観測する。
実世界のデータでは、人間はモデルに比べて性別に偏った決定を$sim$3%多くし、合成データモデルでは$sim$12%の偏りがある。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:51:44 GMT)
Harnessing the Power of Large Language Models for Natural Language to
First-Order Logic Translation [11.7] 本稿では,単一GPU上でLoRAを用いたNL-FOL翻訳のためのモデルであるLogicLLaMAを紹介する。
LogicLLaMAは、自然言語を直接FOLルールに変換することができ、GPT-3.5より優れている。
また、GPT-3.5で予測されるFOLルールの修正も可能で、GPT-4と同等の性能をコストのごく一部で達成できる。
論文参考訳(メタデータ) (Wed, 24 May 2023 19:59:51 GMT)
SUVR: A Search-based Approach to Unsupervised Visual Representation
Learning [11.6] 画像ペアは様々な類似度を持つべきであり、負のサンプルはデータセット全体から引き出すことができるべきだ、と我々は主張する。
本研究では,教師なしの方法でより優れた画像表現を学習するために,検索に基づく教師なし視覚学習(SUVR)を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:57:58 GMT)
Prompt Optimization of Large Language Model for Interactive Tasks
without Gradient and Demonstrations [11.6] 大規模言語モデル(LLM)は言語能力に優れるが、対話型タスクを独立して解く際には課題に直面している。
グラデーションアクセスや広範囲な実証を行うことなく,LSMがこれらの課題に対処できる新しいアプローチ LLM-PO を提案する。
HotpotQAの実験では、LLM-POはテキスト内学習(ICL)のベースラインよりも高いもしくは同等の成功率を達成することが示された。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:52:23 GMT)
GPT4Graph: Can Large Language Models Understand Graph Structured Data ?
An Empirical Evaluation and Benchmarking [11.5] ChatGPTのような大規模言語モデルは、人工知能にとって欠かせないものとなっている。
本研究では,グラフデータの解釈において,LLMの精度を評価するための調査を行う。
この知見は,言語モデルとグラフ理解のギャップを埋めるための貴重な洞察に寄与する。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:53:19 GMT)
KARNet: Kalman Filter Augmented Recurrent Neural Network for Learning
World Models in Autonomous Driving Tasks [11.5] 本稿では、フロントカメラ画像のみを用いて、交通流の潜在表現を学習するために、Kalmanフィルタの強化されたリカレントニューラルネットワークアーキテクチャを提案する。
その結果,車両の明示的なモデル(カルマンフィルタを用いて推定した状態)をエンドツーエンド学習に組み込むことで,性能が著しく向上した。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:27:34 GMT)
Cost-aware learning of relevant contextual variables within Bayesian
optimization [11.5] 本稿では,コストを考慮したモデル選択BOタスクとして,感性分析駆動型コンテキストBO(SADCBO)を紹介する。
我々は,特定の入力点における後代代理モデルの感度解析により,文脈変数の妥当性を学習する。
提案したSADCBOを, 合成実験における代替品に対して実験的に評価した。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:30:15 GMT)
Adversarial Training for Gradient Descent: Analysis Through its
Continuous-time Approximation [11.4] 敵対的トレーニングは、ディープニューラルネットワークの最も効果的な防御の1つとして、大いに人気を集めている。
本稿では,対戦訓練のミニマックスゲームに対する連続時間近似を確立する。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:37:58 GMT)
How Old is GPT?: The HumBEL Framework for Evaluating Language Models
using Human Demographic Data [11.4] 我々は、事前学習言語モデル(LM)を人間のサブ人口と比較し、どのように測定するかを検討する。
私たちのフレームワークは、コード、データ、およびpythonパッケージを介して公開されます。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:55:24 GMT)
Editing Commonsense Knowledge in GPT [11.4] $MEMIT_CSK$は、GPT-2 LargeとXLの常識ミスを編集するためのMEMITの適応である。
MEMIT_CSK$で編集されたモデルは、PEP3kと20Qのサブセットで10.97%、F1スコアが10.73%の微調整ベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:50:54 GMT)
Efficient Transformers with Dynamic Token Pooling [11.3] 言語モデルに動的プール機構を組み、セグメント境界を自己回帰的に予測する。
その結果、動的プーリングはバニラ変換器よりも高速かつ高精度であることがわかった。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:32:56 GMT)
Diffusion Models in NLP: A Survey [11.2] 拡散モデルは、ネットワークや多様体にまたがる情報や信号の拡散を捉える。
本稿は,NLPで使用される拡散モデルの異なる定式化,その強度と限界,それらの応用について論じる。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:25:32 GMT)
From chocolate bunny to chocolate crocodile: Do Language Models
Understand Noun Compounds? [11.2] 名詞複体解釈は、自由文パラフレーズで名詞複体を表現するタスクである。
GPT-3が標準課題をほぼ完璧に解くことを示す。
次に,名詞複合概念化の課題について検討する。
論文参考訳(メタデータ) (Wed, 24 May 2023 21:30:11 GMT)
Different Affordances on Facebook and SMS Text Messaging Do Not Impede
Generalization of Language-Based Predictive Models [11.2] 我々は、Facebookとテキストメッセージの心理言語学的差異について検討した。
トレーニング済みの言語モデルを用いて、年齢、性別、抑うつ、生活満足度、およびFacebookとSMSのストレスを推定しました。
これらの結果は、トレーニング済みのFacebook言語モデルを使用して、ジャスト・イン・タイムの介入によって精度を向上させることを示唆している。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:44:31 GMT)
Deep Pipeline Embeddings for AutoML [11.2] AutoMLは、最小限の人間の専門知識で機械学習システムを自動デプロイすることで、AIを民主化するための有望な方向である。
既存のパイプライン最適化テクニックでは、パイプラインステージ/コンポーネント間の深いインタラクションを探索できない。
本稿では,機械学習パイプラインのコンポーネント間のディープインタラクションをキャプチャするニューラルアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 19:29:19 GMT)
Toward Adaptive Semantic Communications: Efficient Data Transmission via
Online Learned Nonlinear Transform Source-Channel Coding [11.1] 深層学習モデルの過剰適合性を利用したオンライン学習型ジョイントソースとチャネルコーディング手法を提案する。
具体的には,市販の事前訓練型モデルを軽量なオンライン方式で展開し,ソースデータと環境領域の分散シフトに適応させる。
私たちはオーバーフィットの概念を極端に捉え、モデルや表現を個々のデータやチャネル状態インスタンスに適応させる実装フレンドリな一連のメソッドを提案します。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:13:21 GMT)
ASPER: Answer Set Programming Enhanced Neural Network Models for Joint
Entity-Relation Extraction [11.0] 本稿では ASP-enhanced Entity-Relation extract (ASPER) という新しいアプローチを提案する。
ASPERは、データとドメインの知識の両方から学習することで、エンティティと関係を共同で認識する。
特に、ASPERはニューラルネットワークモデルの学習プロセスにおいて、事実知識(ASPで事実として表現される)と派生知識(ASPで規則として表現される)を活用する。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:32:58 GMT)
Matrix Estimation for Offline Reinforcement Learning with Low-Rank
Structure [11.0] エージェントが環境と相互作用せず、行動ポリシーを用いて収集されたオフラインデータに頼らなければならないオフライン強化学習(RL)について考察する。
事前の作業は、評価対象方針が行動方針によってカバーされている場合に、政策評価を保証する。
そこで本稿では,低ランク構造を利用したオフラインポリシ評価アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 23:49:06 GMT)
Aligning Language Models to User Opinions [11.0] ユーザの意見や人口統計やイデオロギーが相互予測者ではないことが判明した。
ユーザの意見とユーザ人口、イデオロギーの両方をモデル化することで、LCMを整合させる。
人口統計学とイデオロギーを併用したLCMの典型的なアプローチに加えて,個人ユーザからの最も関連性の高い過去の意見を活用すれば,より正確なユーザ意見の予測が可能になることが判明した。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:11:11 GMT)
COMET-M: Reasoning about Multiple Events in Complex Sentences [10.8] 本稿では,複合文中の対象事象に対するコモンセンス推論を生成可能なイベント中心のコモンセンスモデルであるCOMET-Mを提案する。
COMET-Mは、単純な文に対するイベント中心の推論を排他的に生成するCOMETの上に構築されている。
論文参考訳(メタデータ) (Wed, 24 May 2023 01:35:01 GMT)
Markov $\alpha$-Potential Games: Equilibrium Approximation and Regret
Analysis [10.7] 本稿ではマルコフゲームにおけるマルチエージェントインタラクションを研究するための新しいフレームワークを提案する。
マルコフ$alpha$-ポテンシャルゲームにおける定常ナッシュ均衡を近似する2つのアルゴリズムが導入された。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:01:12 GMT)
Dimensionality Reduction as Probabilistic Inference [10.7] 次元性低減(DR)アルゴリズムは、高次元データを低次元表現に圧縮し、データの重要な特徴を保存する。
本稿では,多種多様な古典DRアルゴリズムを確率的推論アルゴリズムとして解釈するProbDR変分フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 21:56:08 GMT)
Iteratively Improving Speech Recognition and Voice Conversion [10.5] 本稿ではまず,VCモデルのトレーニング中にコンテンツ保存を確保するために使用されるASRモデルをトレーニングする。
次のイテレーションでは、データ拡張手法としてVCモデルを使用し、ASRモデルをさらに微調整し、多様な話者に一般化する。
改良されたASRモデルをVCモデルと逆転モデルの訓練に反復的に活用することにより、両モデルの改善を実験的に示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:45:42 GMT)
Human-Centered Metrics for Dialog System Evaluation [10.4] 心理的な「人間」レンズを用いて対話システムを評価するための指標を提示する。
これらの指標を、7つの標準ダイアログシステムデータセット上の6つの最先端自動メトリクスと比較する。
提案手法は,新規な情報を提供し,自動メトリクスとは無関係であり,クラウドソースによるダイアログ判定を予測するための既存の自動メトリクスを超えた精度の向上につながることを実証する。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:02:32 GMT)
Are Pre-trained Language Models Useful for Model Ensemble in Chinese
Grammatical Error Correction? [10.3] 4つの洗練された単一モデルを持つ強力なPLMに基づくアンサンブル戦略を探索する。
性能は向上しないが、PLMベースのアンサンブル後にさらに悪化する。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:18:52 GMT)
Advancements in Arabic Grammatical Error Detection and Correction: An
Empirical Investigation [10.3] 文法的誤り訂正(英: Grammatical error correct, GEC)は、英語でよく研究されている問題である。
しかし、データ不足や言語の複雑さといった問題により、形態学的に豊かな言語におけるGECの研究は限られている。
本稿では,2つの新しいトランスフォーマーを用いたプレトレーニングシーケンス・ツー・シーケンスモデルを用いて,アラビア語 GEC に関する最初の結果を示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:12:58 GMT)
Commonsense Knowledge Assisted Deep Learning for Resource-constrained
and Fine-grained Object Detection [10.1] 本稿では,コモンセンスの知識を応用して,粗粒度検出の精度向上を支援する手法を提案する。
本手法は,アノテートデータの量が少なく,モデルサイズも小さく,高精度な粒度検出を実現する。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:39:11 GMT)
Complex Logical Reasoning over Knowledge Graphs using Large Language
Models [10.1] 知識グラフ(KG)に対する推論は、エンティティ間の関係を深く理解する必要がある課題である。
現在のアプローチは、論理的なクエリ操作のために、ベクトル空間にエンティティを埋め込むための学習ジオメトリに依存している。
本稿では,文脈的KG探索と論理的クエリ推論を組み合わせた複雑なKG推論を定式化する,言語誘導型知識グラフによる抽象推論(LARK)を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 21:08:09 GMT)
Conceptor-Aided Debiasing of Large Language Models [10.0] 事前訓練された大規模言語モデル(LLM)は、トレーニングコーパスの社会的バイアスを反映している。
我々は,BERT や GPT などの LLM のバイアス部分空間を同定し,除去するためのソフトプロジェクション手法である概念を用いた。
提案手法は,(1)後処理によるバイアス部分空間投影,(2)新しいアーキテクチャ,CI-BERT (Conceptor-intervened BERT) を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:04:06 GMT)
Linear Neural Network Layers Promote Learning Single- and Multiple-Index
Models [10.0] 我々のフレームワークは、すべて同じキャパシティを持つが、暗黙的に定義された表現コストを持つ、様々な深さのネットワーク群を考察する。
この結果から,ReLUネットワークに線形層を追加することで,低ランク線形演算子で近似可能な関数を求める表現コストが得られることがわかった。
論文参考訳(メタデータ) (Wed, 24 May 2023 22:10:12 GMT)
Mastering the ABCDs of Complex Questions: Answer-Based Claim
Decomposition for Fine-grained Self-Evaluation [9.8] 本稿では,質問を真偽のクレームに分解する手法であるABCDを提案する。
ABCDクレームを分解し, きめ細かい自己評価を行う。
GPT-3.5は、その答えがどの程度入力された質問の基準を満たすかを決定する能力を持っていることがわかった。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:53:11 GMT)
Active Learning for Natural Language Generation [9.7] 本稿では,テキスト生成のためのアクティブラーニングに関する最初の体系的研究を行い,多様なタスクセットと複数のAL戦略について考察する。
以上の結果から,既存のAL戦略は,分類に成功しても,テキスト生成シナリオにはほとんど効果がないことが示唆された。
分類と生成シナリオの顕著な違いを強調し,既存のAL戦略の選択行動を分析する。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:27:53 GMT)
RankSEG: A Consistent Ranking-based Framework for Segmentation [9.6] 我々はベイズ則やDice-/IoU-校正を含むDice/IoUメトリクスに関するセグメンテーションの理論的基礎を確立する。
ベイズのセグメンテーションルールのプラグインルールにインスパイアされた新しい一貫したランキングベースのフレームワークであるRandDice/RankIoUを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:07:43 GMT)
Why Does ChatGPT Fall Short in Providing Truthful Answers? [9.6] 複雑なオープンドメイン質問応答におけるChatGPTの失敗の解析を行う。
知識、知識のリコール、知識の推論という、QAの失敗に関連する3つの重要な能力を特定します。
その結果, モデルに詳細な外部知識を付与し, 知識リコールのヒントを与え, 推論の指導を行うことで, より誠実に質問に答えることが可能であることが示唆された。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:58:47 GMT)
Masked Audio Text Encoders are Effective Multi-Modal Rescorers [9.6] Masked Language Models (MLM) は、自動音声認識(ASR)システムにおいて、第2パスの再構成に有効であることが証明されている。
入力空間に音響表現を組み込んだマルチモーダルマスキング言語モデルレスコラーMasked Audio Text (MATE)を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:18:00 GMT)
Tricking LLMs into Disobedience: Understanding, Analyzing, and
Preventing Jailbreaks [9.6] 非専門家のユーザは、プロンプトを操作することで、LLM(Large Language Models)をジェイルブレイクすることができる。
我々は、既知の(そして可能な)ジェイルブレイクの形式主義と分類法を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:57:37 GMT)
Can Transformers Learn to Solve Problems Recursively? [9.6] 本稿では,プログラムと形式検証に関連するニューラルネットワーク学習アルゴリズムの挙動について検討する。
これらのアルゴリズムを再構築することにより、近似関数の1つに対して、障害ケースの91%を正確に予測することができる。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:08:37 GMT)
CuRIAM: Corpus re Interpretation and Metalanguage in U.S. Supreme Court
Opinions [9.5] 法律メタ言語の種類を分類するためのアノテーションスキーマを開発する。
弊社のスキーマを、合衆国最高裁判所の一連の意見に適用し、合計59万トークンのコーパスを得る。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:47:55 GMT)
Multiresolution Feature Guidance Based Transformer for Anomaly Detection [9.5] 本稿では,非教師付き異常検出と局所化のためのトランスフォーマーGTransに基づく多分解能特徴誘導手法を提案する。
GTransは、MVTec ADデータセットでAUROCスコア99.0%と97.9%の画像レベルおよび画素レベルの異常検出を実現する。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:31:38 GMT)
Iteratively Improving Biomedical Entity Linking and Event Extraction via
Hard Expectation-Maximization [9.4] バイオメディカル・エンティティ・リンクとイベント抽出は、バイオメディカル・ドメインにおけるテキストの理解と検索を支援する2つの重要なタスクである。
従来の研究は通常、これらの2つのタスクを別々に、あるいはパイプラインで解決し、エラーの伝播につながる。
本稿では,知識ベースにおけるイベント構造とエンティティ参照を潜伏変数として扱うことで,共同生物医学的実体リンクとイベント抽出を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:30:31 GMT)
LaMini-LM: A Diverse Herd of Distilled Models from Large-Scale
Instructions [9.4] 命令を微調整した大規模言語モデル(LLM)は、優れた生成能力を示す。
我々は既存の命令と新しく生成された命令の両方に基づいて258万の命令を大規模に開発する。
我々は、エンコーダデコーダとデコーダのみのファミリーの両方のモデルを含む、LaMini-LMと呼ばれる様々なモデルの群を微調整する。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:15:26 GMT)
Predicting Token Impact Towards Efficient Vision Transformer [9.3] 自己注意の前に無関係なトークンを減らすためのトークンフィルタリングは、効率的な視覚変換を実現するための簡単な方法である。
これは、機能選択の観点からトークンフィルタリングを閲覧する最初の作業であり、一度マスクされた損失をどの程度変えられるかに応じてトークンの重要性を重み付けします。
提案手法は, バックボーンを微調整により最適化した後, 光重み付きモデルに効率よくアプローチする方法を提供する。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:44:16 GMT)
Universal Prompt Tuning for Graph Neural Networks [9.3] 我々は,任意の事前学習戦略の下で,事前学習したGNNモデルに対して,GPF(Graph Prompt Feature)と呼ばれる普遍的なプロンプトベースのチューニング手法を提案する。
GPFは入力グラフの特徴空間上で動作し、理論的には任意の形式のプロンプト関数に等価な効果を達成できる。
本手法は,事前学習戦略を応用したモデルに適用した場合,既存の特殊プロンプトベースのチューニング手法よりも大幅に優れる。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:04:26 GMT)
CDIDN: A Registration Model with High Deformation Impedance Capability
for Long-Term Tracking of Pulmonary Lesion Dynamics [9.3] 本稿では,医療用CT画像の登録問題について,新しい視点から検討する。
我々はCascade-Dilation Inter-Layer Differential Network (CDIDN)と呼ばれる新しい登録モデルを提案する。
高い変形能力(DIC)と精度を示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:45:44 GMT)
Annotation Imputation to Individualize Predictions: Initial Studies on
Distribution Dynamics and Model Predictions [9.1] 提案手法は,すべての例に対して全アノテータの意見を復元するための命令法である。
次に、インプットされたデータセットからデータを使ってモデルをトレーニングし、プロンプトして、多数派と個別のアノテーションについて予測します。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:54:46 GMT)
Practical and Matching Gradient Variance Bounds for Black-Box
Variational Bayesian Inference [8.9] BBVI は勾配降下文学で用いられる$ABC$条件に対応する整合性を満たすことを示す。
また,平均場パラメタライゼーションのばらつきは,次元依存性が良好であることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:17:29 GMT)
Optimal Control of Logically Constrained Partially Observable and
Multi-Agent Markov Decision Processes [8.9] まず、部分的に観測可能なマルコフ決定過程に対する最適制御理論を導入する。
累積報酬を最大化するポリシを合成するための構造化手法を提供する。
次に、論理的に制約されたマルチエージェント設定のための最適制御フレームワークを設計するために、このアプローチを構築します。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:15:36 GMT)
Self-Supervised Learning for Point Clouds Data: A Survey [8.9] 自己監督学習(SSL)は、時間と労働集約的なデータラベリング問題を解決するための重要なソリューションであると考えられている。
本稿では,ポイントクラウドにおけるSSLの最近の進歩を包括的に調査する。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:42:21 GMT)
Neural Summarization of Electronic Health Records [8.8] 本研究では,4つの最先端ニューラルネットワーク要約モデルを用いて,放電要約の様々な部分の自動生成の実現可能性について検討した。
従来の微調整言語モデルでは、レポート全体を要約する性能が向上した。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:05:53 GMT)
Sampling-based Uncertainty Estimation for an Instance Segmentation
Network [8.8] 機械学習(ML)モデルの予測の不確かさが注目されている。
この目的のために使用される不確実性モデリング手法の1つはモンテカルロ・ドロープアウトであり、単一の入力に対して繰り返し予測が生成される。
この記事では、ベイジアン・ガウス混合(BGM)を用いてこの問題を解決する。
さらに、各インスタンスの最も正確な不確実性近似を得るために、Mask-RCNNモデルに統合した焦点損失やキャリブレーションなど、ドロップアウト率と他の手法の異なる値について検討する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:12:50 GMT)
Carving UI Tests to Generate API Tests and API Specification [8.7] APIレベルのテストは、単体レベルのテストとUIレベルの(あるいはエンドツーエンドの)テストの間で重要な役割を果たす。
既存のAPIテストツールにはAPI仕様が必要である。
WebアプリケーションのAPIレベルのテストを可能にするために,UIテストを活用するアプローチを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:53:34 GMT)
A Game-Theoretic Framework for AI Governance [8.7] 規制当局とAI企業間の戦略的相互作用は、Stackelbergのゲームを連想させる固有の構造を持っていることを示す。
本稿では,AIガバナンスのためのゲーム理論モデリングフレームワークを提案する。
私たちの知る限りでは、この研究はAIガバナンスの分析と構造化にゲーム理論を使った最初のものである。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:18:42 GMT)
On Degrees of Freedom in Defining and Testing Natural Language
Understanding [8.6] 自然言語理解研究は、しばしばシステムの能力を誇張または過小評価する。
これらの誤った評価は、NLUを適切に定義し、テストすることの難しさに起因する。
本稿では,テストコンポーネント間の一連の検証基準を構成するフレームワークである妥当性議論を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:25:20 GMT)
Large Language Models are Few-Shot Health Learners [8.5] 大規模言語モデル(LLM)は、現実世界のタスクに有用な概念のリッチな表現をキャプチャできる。
健康アプリケーションは、モデルを数値データでグラウンド化する必要がある。
数ショットのチューニングで、大規模言語モデルが様々な生理的・行動的時系列データをグラウンド化できることを実証する。
論文参考訳(メタデータ) (Wed, 24 May 2023 19:25:16 GMT)
Digital Twins for Industry 4.0 in the 6G Era [8.5] 6Gは将来の知的産業のインフラ的バックボーンとして構想されている。
本稿では, 6G 搭載産業用 DT システムの研究領域について調査する。
論文参考訳(メタデータ) (Wed, 24 May 2023 19:07:10 GMT)
Balancing Effect of Training Dataset Distribution of Multiple Styles for
Multi-Style Text Transfer [8.3] 本稿では,データ入力の多様性がマルチスタイル転送モデルから生成したテキストの品質に与える影響について検討する。
トレーニングサンプルのスタイル分布を調整するために,擬似並列データセットを構築した。
バランスの取れたデータセットは、バランスの取れていないデータセットや歪んだデータセットよりも、複数のスタイルに対して効果的な制御効果をもたらす。
論文参考訳(メタデータ) (Wed, 24 May 2023 21:36:15 GMT)
Representation Online Matters: Practical End-to-End Diversification in
Search and Recommender Systems [8.3] Pinterestの検索結果とレコメンデーションの表現を改善するために、エンドツーエンドの多様化を導入する。
Pinterestプラットフォーム上で、複数のプロダクションサーフェスでスケーラブルな多様化メカニズムを開発し、実験し、展開する。
当社のアプローチは,ユーティリティメトリクスに対する肯定的な影響とユーザ満足度の向上を伴って,多様性指標を大幅に改善しています。
論文参考訳(メタデータ) (Wed, 24 May 2023 19:43:26 GMT)
Discounting in Strategy Logic [8.3] SLdisc[D] と表記される一連の割引関数 D に対して、将来の割引でStrategy Logic を拡張する。
モデルチェックを行うSLdisc[D]-formulasの複雑さについて検討する。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:40:53 GMT)
Don't Trust GPT When Your Question Is Not In English [8.3] 大規模言語モデル(LLM)は、例外的な自然言語理解能力を示している。
本論文では,多言語環境下でのLLMの性能格差を体系的に評価する方法を提案する。
その結果,GPTは多言語設定において高い翻訳的振る舞いを示すことがわかった。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:05:03 GMT)
Dolphin: A Challenging and Diverse Benchmark for Arabic NLG [8.0] ドルフィン(Dolphin)は、アラビア語の言語や品種を幅広く収集するための評価フレームワークの必要性に対処する新しいベンチマークである。
Dolphinは、50のテストスプリットにまたがる40の多様性と代表的なパブリックデータセットからなる、実質的なコーパスで構成されている。
アラビア語および多言語モデルの性能と一般化能力を評価するための新しい標準を設定している。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:24:10 GMT)
ByteSized32: A Corpus and Challenge Task for Generating Task-Specific
World Models Expressed as Text Games [8.0] 本研究では,言語モデルが科学的・常識的推論タスクの明示的な世界モデルを生成する能力について検討する。
ByteSized32は、Pythonで書かれた32の高度に測定されたテキストゲームのコーパスである。
シミュレーション・アズ・コード生成タスクにおけるGPT-4の単発評価により,27%のケースで実行可能なゲームを生成することができることがわかった。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:31:30 GMT)
AdvFunMatch: When Consistent Teaching Meets Adversarial Robustness [7.9] 本稿では,AdvFunMatch (AdvFunMatch) という簡易かつ効果的な手法を提案する。
トレーニングデータの$ellp$-normボール内のすべてのデータポイントの分布を、一貫した教育に従って一致させることを目的としている。
実験結果から,AdvFunMatchはクリーンさとロバストさの両面から学生モデルを効果的に生成できることが示唆された。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:09:08 GMT)
Machine learning-based characterization of hydrochar from biomass:
Implications for sustainable energy and material production [7.7] HTC (Hydrothermal Carbonization) は、バイオマスを事前乾燥することなく多用途のハイドロチャーに変換するプロセスである。
本研究の目的は, 異なるバイオマス源から生産されるヒドロチャーを, 異なる反応処理パラメータで特徴付けるモデルを開発することである。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:55:54 GMT)
GTNet: Graph Transformer Network for 3D Point Cloud Classification and
Semantic Segmentation [7.7] グラフベースのディープラーニングネットワークとTransformerベースのディープラーニングネットワークは、さまざまなポイントクラウドタスクで優れたパフォーマンスを示している。
本稿では,Graph Transformerという新機能抽出ブロックを提案し,GTNetと呼ばれる3Dポイントクラウド学習ネットワークを構築した。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:51:18 GMT)
AutoDepthNet: High Frame Rate Depth Map Reconstruction using Commodity
Depth and RGB Cameras [7.7] 本稿では,遅延を低減し,奥行きカメラのフレームレートを向上させるために,高速かつ高精度な深度マップ再構成手法を提案する。
私たちのアプローチでは、ハイブリッドカメラのセットアップでは、コモディティデプスカメラとカラーカメラのみを使用します。
提案するネットワークであるAutoDepthNetは、高速RGBカメラからフレームをキャプチャし、それらを以前の深度フレームと組み合わせて高フレームレート深度マップのストリームを再構築するエンコーダデコーダモデルである。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:09:43 GMT)
ForestPrune: Compact Depth-Controlled Tree Ensembles [7.5] 我々は,個々の木から深度層を刈り取ることで,木アンサンブルを後処理する新しいフレームワークであるフォレストプルーを紹介する。
本研究では,フォレストプルーネにおける問題に対する高品質な解を効率的に得るための最適化アルゴリズムを開発した。
実験により、フォレストプルーンは既存の後処理アルゴリズムによって抽出されたモデルより優れたパシモニアスモデルを生成することを示した。
論文参考訳(メタデータ) (Wed, 24 May 2023 20:17:05 GMT)
Post-processing Private Synthetic Data for Improving Utility on Selected
Measures [7.4] 本稿では,エンドユーザが選択した尺度に関して,合成データの有用性を向上するポストプロセッシング手法を提案する。
我々のアプローチは、複数のベンチマークデータセットと最先端の合成データ生成アルゴリズムにまたがる合成データの有用性を一貫して改善する。
論文参考訳(メタデータ) (Wed, 24 May 2023 19:49:50 GMT)
Exploring Diverse In-Context Configurations for Image Captioning [7.3] Vision-Languageドメインの研究者も、テキスト内の画像とテキストのペアを構成するのに最も簡単な方法しか使用せずに、数ショットの学習者を開発している。
画像選択のための4つの戦略と、キャプション代入のための4つの戦略を考案し、画像キャプションのためのインテキスト画像-テキストペアを設定した。
包括的実験により2つの反直感的だが価値ある洞察が得られ,視覚・言語内学習の特徴を浮き彫りにした。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:52:47 GMT)
Technical report: Graph Neural Networks go Grammatical [7.3] 本稿では,代数言語の断片をグラフニューラルネットワーク(GNN)に正式にリンクする枠組みを提案する。
文脈自由文法(CFG)を用いて代数演算を生成規則に整理し、GNN層モデルに変換する。
いくつかの実験は、G$2$N$2$が、多くの下流タスクで他の3WL GNNよりも効率良く優れていることを示している。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:59:50 GMT)
UniChart: A Universal Vision-language Pretrained Model for Chart
Comprehension and Reasoning [7.2] We present UniChart, a pretrained model for chart comprehension and reasoning。
UniChartは、チャートの関連するテキスト、データ、および視覚要素をエンコードし、その後、チャートグラウンドのテキストデコーダを使用して、自然言語で期待される出力を生成する。
i) チャートから視覚要素(バーや線など)とデータを抽出する低レベルタスク、(ii) チャート理解と推論のスキルを得るための高レベルタスクなどである。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:11:17 GMT)
A Multi-stage Transfer Learning Framework for Diabetic Retinopathy
Grading on Small Data [7.1] 糖尿病網膜症(DR)は、現在知られている主要な盲腸疾患の一つである。
本稿では,多段階移動学習のアイデアをDRのグルーピングタスクに適用する。
作業中にクラスバランスの損失関数を提示し、それに対してシンプルで実装の容易なトレーニング手法を採用する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:01:24 GMT)
SciReviewGen: A Large-scale Dataset for Automatic Literature Review
Generation [7.0] SciReviewGenは1万以上の文献レビューと690,000の論文で構成されています。
人間による評価の結果、機械による要約は人間によるレビューに匹敵する結果が得られた。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:26:30 GMT)
Generating Teammates for Training Robust Ad Hoc Teamwork Agents via
Best-Response Diversity [6.9] アドホックチームワーク(Ad hoc teamwork、AHT)は、未知のチームメイトと効果的に協力する堅牢な学習エージェントを設計する挑戦である。
初期のアプローチは、手作りのチームメイトポリシーの多様なセットで学習者をトレーニングすることで、AHTの課題に対処する。
近年,情報理論の多様性指標を最適化することにより,チームメイトポリシーを用いて学習者の堅牢性を向上させる手法が提案されている。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:54:53 GMT)
Short and Straight: Geodesics on Differentiable Manifolds [6.9] 本研究では,測地線長を最小化するための既存の手法をまず解析する。
次に,連続多様体上の距離場と測地流のモデルに基づくパラメータ化を提案する。
第3に,Ricciスカラーのより大きい値を示す多様体の領域において,曲率に基づくトレーニング機構,サンプリングおよびスケーリングポイントを開発する。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:09:41 GMT)
Personalized Dictionary Learning for Heterogeneous Datasets [6.8] パーソナライズド辞書学習(PerDL)という問題を紹介した。
目的は、共通点を共有する異種データセットから疎線型表現を学ぶことである。
PerDLでは、各データセットの共有およびユニークな機能をグローバルおよびローカル辞書としてモデル化します。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:31:30 GMT)
TAMUNA: Doubly Accelerated Federated Learning with Local Training,
Compression, and Partial Participation [6.8] 連合学習では、多くのユーザが協力してグローバルモデルを学ぶ。
分散最適化とフェデレート学習のための最初のアルゴリズムであるTAMUNAを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:08:20 GMT)
Improving selective classification performance of deep neural networks
through post-hoc logit normalization and temperature scaling [6.8] 本稿では,ディープニューラルネットワークの選択的分類の問題に対処する。
p$-NormSoftmaxという簡易で効率的なポストホック信頼度推定器を提案する。
本手法は, リスク被覆曲線下での平均16%の改善率を示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:56:55 GMT)
#REVAL: a semantic evaluation framework for hashtag recommendation [6.7] 本稿では,ハッシュタグレコメンデーションのための新しいセマンティックアセスメントフレームワーク#REvalを提案する。
#REvalにはBERTagと呼ばれる内部モジュールが含まれており、自動的にハッシュタグの埋め込みを学習する。
大規模な3つのデータセットを用いた実験の結果,#Revalはハッシュタグ推薦評価に有意義なハッシュタグシノニムを付与した。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:10:56 GMT)
On Consistency of Signatures Using Lasso [6.7] 本稿では,シグネチャ変換におけるラッソ回帰の整合性問題を再検討する。
我々の研究は、ブラウン運動に近いプロセスや時系列や、より弱い次元間相関を持つランダムウォークに対して、ラッソ回帰はイオ積分によって定義されるシグネチャに対してより一貫性があることを示している。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:59:38 GMT)
Learning INR for Event-guided Rolling Shutter Frame Correction, Deblur,
and Interpolation [6.6] 高速カメラ動作下でローリングシャッター(RS)によって撮影された画像は、しばしば明らかな画像歪みとぼやけを含む。
暗黙の符号化(STE)を導入し、RSのぼやけた画像やイベントを時空間表現(STR)に変換する。
本手法は,タスクの1つないし2つだけに対処する先行手法を著しく上回っている。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:57:03 GMT)
A Joint Time-frequency Domain Transformer for Multivariate Time Series
Forecasting [6.6] 本稿では,多変量予測のための共同時間周波数領域変換器(JTFT)を提案する。
この方法は、少数の学習可能な周波数を用いて周波数領域における時系列の間隔を利用して、時間依存性を効果的に抽出する。
6つの実世界のデータセットで実施された実験は、JTFTが最先端の手法より優れていることを示した。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:37:23 GMT)
MMNet: Multi-Mask Network for Referring Image Segmentation [6.5] 画像セグメンテーション(MMNet)のためのエンドツーエンドマルチマスクネットワークを提案する。
まず、画像と言語を組み合わせて、言語表現の異なる側面を表す複数のクエリを生成する。
最終的な結果は、すべてのマスクの重み付け和によって得られ、言語表現のランダム性を大幅に減少させる。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:02:27 GMT)
Off-Policy Evaluation with Online Adaptation for Robot Exploration in
Challenging Environments [6.5] 本稿では、状態値関数によって測定された「良い」状態がどのようにあるかを学習し、ロボット探査のガイダンスを提供する。
実世界のデータに関するオフラインのモンテカルロトレーニングと、トレーニングされた値推定器を最適化するために時間差分(TD)オンライン適応を実行する。
以上の結果から,ロボットが将来の状態を予測し,ロボット探索の指針となることが示唆された。
論文参考訳(メタデータ) (Wed, 24 May 2023 20:18:32 GMT)
torchgfn: A PyTorch GFlowNet library [6.4] torchgfnはPyTorch上に構築されたライブラリで、両方の問題に対処することを目的としている。
環境のためのシンプルなAPIと、サンプルと損失のための有用な抽象化を提供する。
論文参考訳(メタデータ) (Wed, 24 May 2023 00:20:59 GMT)
Let There Be Order: Rethinking Ordering in Autoregressive Graph
Generation [6.4] 条件付きグラフ生成タスクは、入力条件のセットが与えられたグラフを生成するためにモデルを訓練する。
従来の多くの研究では、ノードやエッジなどのグラフコンポーネントを漸進的に生成するために自己回帰モデルを用いていた。
グラフは通常、コンポーネント間で自然な順序付けを欠いているため、グラフをトークンの列に変換することは簡単ではない。
論文参考訳(メタデータ) (Wed, 24 May 2023 20:52:34 GMT)
Collaborative Development of NLP models [6.2] 我々は,NLPモデルとのマルチユーザインタラクションを実現するフレームワークであるCoDevを紹介する。
CoDevは、ユーザーが大規模言語モデルを使って概念を運用するのを助ける。
次に、大きな言語モデルを使って、ローカルとグローバルの意見が一致しない概念境界内のインスタンスを生成します。
論文参考訳(メタデータ) (Wed, 24 May 2023 22:05:16 GMT)
READ: Recurrent Adaptation of Large Transformers [6.0] モデルサイズとタスク数が増加するにつれて、微調整の大規模トランスフォーマーは実用的ではない。
textbfREcurrent textbfADaption (READ) を導入する。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:59:41 GMT)
Mitigating climate and health impact of small-scale kiln industry using
multi-spectral classifier and deep learning [6.0] 小規模産業、特にブルトレンチレンガキルンは南アジアにおける大気汚染の重要な原因の1つである。
本稿では,南アジアの「Brick-Kiln-Belt」におけるレンガキルン検出のための高分解能画像を用いた多スペクトルデータの融合を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:31:10 GMT)
Evidence of Meaning in Language Models Trained on Programs [5.9] 我々は,テキスト上で次のトークン予測を行うためにのみ訓練された言語モデルが意味を学習できることを示す。
まず、プログラムのコーパス上でTransformerモデルをトレーニングし、指定したプログラムを完了すると、トレーニングされたモデルの隠れた状態を探索する。
プローブの精度と、仕様を実装するプログラムを生成するモデルの能力との間には、強く統計的に有意な相関関係がある。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:52:13 GMT)
Optimization-Based Improvement of Face Image Quality Assessment
Techniques [5.8] 顔画像品質評価(FIQA)技術は、認識プロセスに役立つ入力顔画像からサンプル品質情報を推測しようとする。
本稿では,既存のFIQA技術の性能向上を目的とした品質ラベル最適化手法を提案する。
提案手法を6つの最先端FIQA手法による包括的実験で評価した。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:06:12 GMT)
Reconstruction, forecasting, and stability of chaotic dynamics from
partial data [5.8] 本研究では,部分的な観測から隠れカオス変数の力学を推定するためのデータ駆動手法を提案する。
提案するネットワークは,時間的・統計的に隠れた変数を予測できることを示す。
この研究は、完全な状態を再構築し、隠れた変数を推論し、部分的なデータからカオスシステムの安定性を計算する新しい機会を開く。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:01:51 GMT)
Towards Fine-Grained Localization of Privacy Behaviors [5.7] PriGenは静的解析を使用して、機密情報を処理するAndroidアプリケーションのコードセグメントを識別する。
本稿では,30万のコードセグメントに対する翻訳タスクの初期評価について述べる。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:32:14 GMT)
Segmented Recurrent Transformer: An Efficient Sequence-to-Sequence Model [5.7] トランスフォーマーは、言語や視覚など、さまざまな領域において、主要なパフォーマンスを示している。
これに対抗するために、我々のアプローチはシーケンス全体をセグメントに分割することである。
セグメントにまたがる情報は、その固有の記憶を活用するニューロンを用いて集約される。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:47:22 GMT)
Perturbative Page Curve Induced by External Impulse [5.6] 我々は、オープン量子系における外部インパルスによって誘起されるエントロピー力学の最近の研究を拡張した。
システムバス結合$kappa$の場合、エントロピーは初期状態において指数関数的に$kappa2 evarkappa t$の増加を期待する。
第二段階では、系のエントロピーは粗粒のエントロピーと等しい。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:08:12 GMT)
A New Era in Software Security: Towards Self-Healing Software via Large
Language Models and Formal Verification [5.5] 本稿では,Large Language Models(LLM)とFormal Verification戦略を組み合わせた新しいソリューションを提案する。
提案手法は,脆弱なコードの修復において,最大80%の成功率を達成した。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:54:10 GMT)
COVID-19 Activity Risk Calculator as a Gamified Public Health
Intervention Tool [5.5] 新型コロナウイルス感染症(COVID-19)は、重症急性呼吸器症候群(SARS)ウイルス2(SARS-CoV-2)によるパンデミックで、200カ国以上が感染し、何百万人もの人が死亡した。
リスク推定装置のような公衆衛生介入は、影響する行動を通じて、パンデミックや流行の拡散を減らすことができる。
本研究では,新型コロナウイルスのリスク計算システムの合理化,拡張性,正確性を実証する。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:14:46 GMT)
Revenge of MLP in Sequential Recommendation [5.2] 本稿では,新しいアンダーラインTriangular Mixerを用いたTriMLPのシーケンシャルレコメンデーションアーキテクチャを提案する。
我々は,TriMLPが有望かつ安定した精度/効率のトレードオフを実現し,最先端のベースラインを5.32%越え,推論時間コストを8.44%削減したことを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:32:31 GMT)
Mpox-AISM: AI-Mediated Super Monitoring for Forestalling Monkeypox
Spread [5.2] スーパーモニタリング」と呼ばれる遠隔・リアルタイムのオンライン可視化戦略を提案する。
このようなAIによる"スーパーモニタリング"(Mpox-AISM)は、ディープラーニング、データ拡張、自己教師型学習によって構築されたフレームワークを起動する。
この戦略は、様々なシナリオにおける早期Mpoxのリアルタイム検出に利用することができる。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:00:33 GMT)
Algorithmic Unfairness through the Lens of EU Non-Discrimination Law: Or
Why the Law is not a Decision Tree [5.2] 我々は、EUの非差別法は、コンピュータサイエンス文学において提案されたアルゴリズム的公正の概念と一致していることを示す。
公正度指標と技術的介入の規範的基盤を設定し、これらをEU司法裁判所の法的理由と比較した。
我々は、AI実践者や規制当局に影響を及ぼすと結論づける。
論文参考訳(メタデータ) (Wed, 24 May 2023 20:11:38 GMT)
Reversible and irreversible bracket-based dynamics for deep graph neural
networks [5.0] 近年の研究では、物理にインスパイアされたアーキテクチャにより、過剰なスムーシングなしにディープグラフニューラルネットワーク(GNN)のトレーニングが可能になることが示されている。
これらの物理学の役割は明確ではなく、可逆性(例えばハミルトン)と非可逆性(例えば拡散)の両方の現象が成功した例がある。
この研究は、構造保存ブラケットに基づく動的システムに基づく、新しいGNNアーキテクチャのシリーズを提示する。
論文参考訳(メタデータ) (Wed, 24 May 2023 23:24:18 GMT)
Optimizing Long-term Value for Auction-Based Recommender Systems via
On-Policy Reinforcement Learning [5.0] オークションベースのレコメンデーターシステムはオンライン広告プラットフォームで広く使われているが、通常、すぐに期待されるリターン指標に基づいてレコメンデーションスロットを割り当てるように最適化されている。
オークションベースのレコメンデーションシステムにおいて,長期リターン指標の最適化に強化学習を用いる。
論文参考訳(メタデータ) (Wed, 24 May 2023 01:04:04 GMT)
The NCTE Transcripts: A Dataset of Elementary Math Classroom Transcripts [4.9] 研究者が利用可能な数学教室の教科書の最大のデータセットについて紹介する。
データセットは、長さ1,660分の4年生と5年生の初等数学の観測から成り立っている。
匿名化された文字起こしは、4つの学区の317人の教師のデータを表現している。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:41:18 GMT)
Data-driven Science and Machine Learning Methods in Laser-Plasma Physics [4.9] 近年の技術的改善により、実験とシミュレーションの両方において、より多くのデータを集めることが可能になった。
これは、数学、統計学、計算機科学の高度な技術を使って、ビッグデータに対処し、利益を得るという関心を喚起した。
本稿では,レーザープラズマ物理への適用性に着目した機械学習手法の概要を述べる。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:15:05 GMT)
An Evaluation on Practical Batch Bayesian Sampling Algorithms for Online
Adaptive Traffic Experimentation [4.9] 本稿では,ベイジアンバッチバンドレートアルゴリズム(NB-TS,WB-TS,NB-TTTS,WB-TTTS)の導出と評価を行う。
4つのベイズサンプリングアルゴリズムに関する総合的な評価は、信頼性、感度、そして試験手法の後悔をカバーしている。
評価の結果, (a) 同等のベストアームを持つ偽陽性インフレが存在する一方で, 文献ではほとんど議論されていないこと, (b) 偽陽性を制御するために, 後続の最適確率の収束と中性後部再形成の関係が発見されたこと, (d) NB-TS は, 精度と堅牢性を除いて, 後悔の試行を最小化すること, (e) WB-TTTS は有望であることが明らかとなった。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:16:56 GMT)
Utility-Probability Duality of Neural Networks [4.9] 本稿では,ディープラーニングにおける標準教師あり学習手順に対するユーティリティに基づく代替的説明を提案する。
基本的な考え方は、学習したニューラルネットワークを確率モデルではなく、順序付きユーティリティ関数として解釈することである。
ソフトマックス出力を持つ全てのニューラルネットワークに対して、最大推定値のSGD学習ダイナミクスを反復過程と見なすことができる。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:09:07 GMT)
On Over-Squashing in Message Passing Neural Networks: The Impact of
Width, Depth, and Topology [4.8] メッセージパッシングニューラルネットワーク(MPNN)は、グラフを利用してエッジにメッセージを送信するグラフニューラルネットワークのインスタンスである。
この帰納バイアスは、ノードの特徴が遠いノードに含まれる情報に敏感であるオーバー・スカッシング(over-squashing)と呼ばれる現象につながる。
この問題を軽減するために近年導入された手法にもかかわらず、過度な監視と解決策の可能性についての理解は欠如している。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:42:49 GMT)
Fault-tolerant qubit encoding using a spin-7/2 qudit [4.7] 本稿では,スピン-1/2量子ビットに結合したスピン7/2核上に実装した量子メモリを提案する。
我々のエンコーディングは、既存の実験的に実現された分子電子-原子核量子スピン系に効率的に実装することができる。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:19:20 GMT)
A Monte Carlo Language Model Pipeline for Zero-Shot Sociopolitical Event
Extraction [4.5] 我々は、アクターのペア間のアクションを特定するために、ダイアドゼロショットイベント抽出(EE)を検討する。
現在のEEメソッドは、単語感覚のあいまいさ、モダリティのミスマッチ、効率性などの問題を含む、タスクに対して不十分に機能する。
モンテカルロ法を用いて, 生成出力のランダム性を活用し, 克服する。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:41:33 GMT)
FaceFusion: Exploiting Full Spectrum of Multiple Datasets [4.4] 我々はFaceFusionという新しいトレーニング手法を提案する。
ビューを使用して埋め込みネットワークを同時にトレーニングしながら、アイデンティティの衝突によって達成されない、さまざまなデータセットの融合ビューを生成する。
統合データセットの統一ビューを使用することで、組み込みネットワークはデータセットのスペクトル全体に対してトレーニングされ、顕著なパフォーマンス向上につながる。
論文参考訳(メタデータ) (Wed, 24 May 2023 00:51:04 GMT)
SITReg: Multi-resolution architecture for symmetric, inverse consistent,
and topology preserving image registration using deformation inversion layers [4.4] 深層学習に基づく変形可能な医用画像登録法が,古典的反復的登録法の強力な代替手段として登場した。
本稿では,対称性,逆整合性,トポロジ保存による新しいマルチレゾリューション登録アーキテクチャを提案する。
提案手法は,2つのデータセットに対する最先端の登録精度を実現する。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:30:46 GMT)
Density Ratio Estimation-based Bayesian Optimization with
Semi-Supervised Learning [4.4] 半教師付き学習を用いた密度比推定に基づくベイズ最適化を提案する。
本研究では,未ラベル点サンプリングと固定サイズのプールを用いた2つの異なるシナリオにおいて,本手法といくつかの基本手法の実験結果を示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 23:01:56 GMT)
Action Languages Based Actual Causality for Computational Ethics: a
Sound and Complete Implementation in ASP [4.4] 本稿では、アクション言語に適した実際の因果関係定義から論理プログラミングへの完全かつ健全な翻訳を提供する。
得られた論理プログラムは複雑な因果関係を扱うことができる。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:43:13 GMT)
ORRN: An ODE-based Recursive Registration Network for Deformable
Respiratory Motion Estimation with Lung 4DCT Images [4.3] 変形可能な画像登録(DIR)は、医療データにおける変形の定量化に重要な役割を果たす。
近年のDeep Learning法では,医用画像の登録に有望な精度とスピードアップが示されている。
本稿では,正規微分方程式(ODE)に基づく再帰画像登録ネットワークORRNを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:26:26 GMT)
How do humans perceive adversarial text? A reality check on the validity
and naturalness of word-based adversarial attacks [4.3] 敵対的攻撃は 不正なアルゴリズムだ 入力テキストを不当に修正して モデルに誤った予測をさせる
378人の被験者を対象に,最先端の手法によるテキスト対逆例の知覚可能性について調査した。
以上の結果から,既存のテキスト攻撃は人間が関与する現実のシナリオでは実行不可能であることが示唆された。
論文参考訳(メタデータ) (Wed, 24 May 2023 21:52:13 GMT)
Community detection in complex networks via node similarity, graph
representation learning, and hierarchical clustering [4.3] コミュニティ検出は、実際のグラフを分析する上で重要な課題である。
この記事では,この課題に対処する3つの新しい階層型フレームワークを提案する。
ブロックモデルグラフと実生活データセットにおける100以上のモジュールの組み合わせを比較します。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:55:38 GMT)
Using Models Based on Cognitive Theory to Predict Human Behavior in
Traffic: A Case Study [4.2] 本研究では,ギャップ受容シナリオにおける人間の行動予測のための認知的確証のある新しいモデルの有用性について検討する。
我々は、このモデルが確立されたデータ駆動予測モデルと競合したり、さらに優れていることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:27:00 GMT)
An optimal sensing protocol for statistically polarized nano-NMR with NV
centers [4.1] 理論的に計算し,ほとんどの実験シナリオにおいて位相感度プロトコルが優れていることを示す。
量子ヘテロダイン検出のための最適実験パラメータを導出し、これまでで最も正確な統計偏極ナノNMRQdyne実験を提示する。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:32:28 GMT)
NegVSR: Augmenting Negatives for Generalized Noise Modeling in
Real-World Video Super-Resolution [4.1] ビデオ超解像(VSR)は、理想的なデータセットから高解像度(HR)ビデオを合成することができる。
VSRモデルを未知の複雑な劣化を伴う実世界のビデオに適用することは、依然として難しい課題である。
ビデオ超解法(NegVSR)課題における一般化ノイズモデリングのための負の強化戦略を提案する。
我々の手法は、特に視覚的品質において、鮮明なマージンを持つ最先端の手法よりも優れている。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:23:35 GMT)
Are Chatbots Ready for Privacy-Sensitive Applications? An Investigation
into Input Regurgitation and Prompt-Induced Sanitization [4.0] ChatGPTは個人識別可能な情報(PII)を57.4%の症例で口頭で保持する。
本稿では,ChatGPTのプライバシ関連ポリシとメカニズムに対する認識を直接指示し,準拠したアウトプットを提供することで,ChatGPTの認識を探索する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:48:05 GMT)
Dual-Side Feature Fusion 3D Pose Transfer [4.0] 3次元ポーズトランスファーは、従来の変形トランスファーの追加入力と対応の問題を解決する。
本稿では、ポーズ転送精度を向上させるために、デュアルサイド特徴核融合ポーズ転送ネットワークを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:42:08 GMT)
Towards the Automatic Generation of Conversational Interfaces to
Facilitate the Exploration of Tabular Data [4.0] タブラルデータは、構造化されたデータをオンラインで公開し、交換する最も一般的なフォーマットである。
データソースの探索を容易にするための対話インタフェースを提案する。
私たちのチャットボットは手作業で作成されるのではなく、データソース自体から自動的に生成されます。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:55:16 GMT)
Simultaneous identification of models and parameters of scientific
simulators [3.9] 我々は,アモートシミュレーションに基づく推論フレームワークを開発した。
固定された候補コンポーネントの集合上で、暗黙的なモデル事前を定義する。
我々はニューラルネットワークをトレーニングし、モデルコンポーネントと関連するパラメータの両方のジョイント確率分布を推定する。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:06:02 GMT)
ANTN: Bridging Autoregressive Neural Networks and Tensor Networks for
Quantum Many-Body Simulation [3.9] 我々は,テンソルネットワークと自己回帰ニューラルネットワークを橋渡しする新しいアーキテクチャであるAutoregressive NeuralNetを開発した。
自己回帰ニューラルネットワークは、正規化波動関数をパラメータ化し、テンソルネットワークと自己回帰ニューラルネットワークの表現性を一般化し、自己回帰ニューラルネットワークから様々な対称性を継承することを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 21:16:07 GMT)
HARD: Hard Augmentations for Robust Distillation [3.8] 本稿では,ロバスト蒸留法(HARD)の高度化による知識蒸留の改善を提案する。
HARDは、教師と生徒が同意しない合成データポイントを生成する。
学習の強化により,ドメイン内およびドメイン外評価におけるKD性能が大幅に向上することが判明した。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:38:44 GMT)
Quantum interpolating ensemble: Biorthogonal polynomials and average
entropies [3.8] 量子純度の平均とアンサンブルのフォン・ノイマンエントロピーは、ヒルベルト・シュミットとビュール=ハルアンサンブルの間で補間される。
提案された補間アンサンブルは、$theta$-deformed Cauchy-Laguerre 2-行列モデルの特殊化である。
論文参考訳(メタデータ) (Wed, 24 May 2023 20:05:30 GMT)
LoopBoxes -- Evaluation of a Collaborative Accessible Digital Musical
Instrument [3.8] LoopBoxesは、特別な教育ニーズを持つ子供のためのループベースの音楽制作への直感的なアクセスを実現するために設計された、アクセス可能なデジタル楽器である。
本報告では,ドイツ・ベルリンの音楽祭におけるパイロット・スタディの形での楽器の評価と,SEN学校における児童・音楽教師とのケーススタディについて述べる。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:29:14 GMT)
Vision + Language Applications: A Survey [3.8] 本稿では,テキスト,視覚,音声などのマルチモーダルアプリケーションにおける研究トラックについて検討する。
本稿で論じる研究に加えて、最新の関連論文、データセット、アプリケーションプロジェクト、および対応する情報を継続的に更新することを約束しています。
論文参考訳(メタデータ) (Wed, 24 May 2023 00:42:06 GMT)
Modifying $n$-qubit controlled-$ZX$ gate to be $n$-qubit Toffoli gate [3.8] 制御されたZX$ゲートの分解は[Phys. A, 87, 062318 (2013)]、アンシラのない浅い回路深さ8n-20$である。
分解後の回路は、現在の物理システムで容易に構築可能であることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:58:54 GMT)
Reliability Scores from Saliency Map Clusters for Improved Image-based
Harvest-Readiness Prediction in Cauliflower [3.7] 我々は、解釈可能な機械学習を用いて、収穫可読性分類器の信頼性を解析する。
目に見えないデータの場合、信頼性は農家に意思決定の改善を知らせるために利用することができる。
全体の精度を88.14%に15.72%改善し、GrowliFlowerデータセットの平均クラス精度を88.52%に15.44%改善しました。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:48:36 GMT)
Inverse Reinforcement Learning with the Average Reward Criterion [3.7] 本稿では, 逆強化学習(IRL)の問題点を, 平均回帰基準を用いて検討する。
目的は、エージェントが経験豊富なエージェントから状態とアクションのサンプルしか持たない場合、未知のポリシーと報酬関数を回復することである。
論文参考訳(メタデータ) (Wed, 24 May 2023 01:12:08 GMT)
ICDAR 2023 Competition on Robust Layout Segmentation in Corporate
Documents [3.7] ICDARは、最先端の技術をベンチマークするコンペを主催する長い伝統がある。
以前のコンペティションよりもバーを上げるために、ハードコンペティションデータセットを設計し、トレーニング用の最近のDocLayNetデータセットを提案しました。
我々は,最近のコンピュータビジョンモデル,データ拡張戦略,アンサンブル手法の興味深い組み合わせを認識し,提案したタスクにおいて顕著な精度を実現する。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:56:47 GMT)
Massively Scalable Inverse Reinforcement Learning in Google Maps [3.6] 本稿では,既存の業務を一般化し,その計画的地平を通した重要な業績トレードオフの制御を可能にするReceding Inverse Planning(RHIP)を紹介する。
我々の結果は、旅行時間を超えた要因が重要な役割を果たす、より持続可能な交通手段に対する重要な利点を示している。
我々は、キーコンポーネントの廃止、最先端の固有値解法に対する否定的な結果、そして将来の機会を特定することで結論付ける。
論文参考訳(メタデータ) (Wed, 24 May 2023 21:38:04 GMT)
Bayesian calibration of differentiable agent-based models [3.6] 本稿では,不特定なベイズパラメータ推定を行うために,一般化された変分推論手法をいかに活用するかを論じる。
我々は、新型コロナウイルスのパンデミックの異なるABM実験で、我々のアプローチが正確な推論をもたらすことを実証した。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:52:32 GMT)
How precise are performance estimates for typical medical image
segmentation tasks? [3.6] 本稿では,医用画像セグメンテーション研究において期待できる,典型的な信頼度を推定することを目的とする。
ガウス仮定とブートストラッピングの両方を用いた精度推定を広範囲に研究した。
全体として、我々の研究は、小さなテストセットが広範囲の信頼区間につながることを示している。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:32:40 GMT)
Policy Learning based on Deep Koopman Representation [3.5] 本論文では,クープマン作用素理論と政策勾配法に基づく政策学習アルゴリズムを提案する。
未知の力学系を近似し、環境との相互作用を通じて収集された観測を用いて、最適政策を同時に探索する。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:27:22 GMT)
Measuring and Modeling Physical Intrinsic Motivation [3.5] 人間は対話的なエージェントであり、興味深い物理力学を持つ状況を探し出す。
私たちはまず、人間が様々な物理シナリオをいかに興味深いかの格付けを集めます。
そこで本研究では,本質的な動機づけの様々な仮説を実装し,人間の興味ある反応をモデル化する。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:47:28 GMT)
Multi-modal Machine Learning for Vehicle Rating Predictions Using Image,
Text, and Parametric Data [3.5] 正確な車両評価予測のためのマルチモーダル学習モデルを提案する。
モデルはパラメトリック仕様、テキスト記述、車両の画像から特徴を同時に学習する。
マルチモーダルモデルの説明力は, 非モーダルモデルよりも4%~12%高いことがわかった。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:58:49 GMT)
The student becomes the master: Matching GPT3 on Scientific Factual
Error Correction [3.5] ほとんどのFactual Claim Correction法は、補正プロセスを導くための強力な検証モデルに依存している。
これにより、Scientific Claim Correctionのようなドメインのパフォーマンスが大幅に低下する。
検証を必要とせず,既存の手法を桁違いに上回る性能を有するクレーム補正システムを導入する。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:24:16 GMT)
Adaptive Policy Learning to Additional Tasks [3.4] 本稿では,事前訓練されたポリシーを調整し,本来のタスクを変更することなく追加タスクに適応するためのポリシー学習手法を開発する。
本稿では,適応政策グラディエント (APG) という手法を提案する。これはベルマンの最適性の原理と,収束率を改善するための政策勾配アプローチを組み合わせたものである。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:31:11 GMT)
Under-Parameterized Double Descent for Ridge Regularized Least Squares
Denoising of Data on a Line [3.4] このモデルに対して、パラメータワイドの2重降下が小さな$mu$に対して発生することを示す。
入力データノイズレギュレータよりもリッジレギュレータを使うことを暗黙的に好んでいるという実証的証拠を提供する。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:52:48 GMT)
Ethics and Deep Learning [3.4] この章では、AIシステムの設計と使用から生じる潜在的な害について考察する。
これにはアルゴリズムバイアス、説明可能性の欠如、データのプライバシー侵害、軍事化、詐欺、環境問題などが含まれる。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:24:19 GMT)
Science in the Era of ChatGPT, Large Language Models and AI: Challenges
for Research Ethics Review and How to Respond [3.4] この論文は、科学行為における課題、倫理的および整合性のリスクをレビューする。
研究機器と課題としてのAI言語モデルの役割は精査されている。
10のレコメンデーションは、AI言語モデルによるより責任ある研究行動に対する応答を形成する。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:23:46 GMT)
Transferring Visual Attributes from Natural Language to Verified Image
Generation [3.3] 本稿では,自然なプロンプトを視覚的プロンプトに変換する自然言語・検証画像生成手法(NL2VI)を提案する。
T2Iモデルは視覚的プロンプトのための画像を生成し、VQAアルゴリズムで検証する。
実験により、自然なプロンプトと画像生成を一致させることで、生成した画像の一貫性を最大11%向上させることができることが示された。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:08:26 GMT)
Generalized Bayesian Inference for Scientific Simulators via Amortized
Cost Estimation [3.3] ニューラルネットワークをトレーニングしてコスト関数を近似し、パラメータと観測データとの予測距離と定義する。
いくつかのベンチマークタスクにおいて、ACEはコストを正確に予測し、他のSBI法よりも合成観測に近い予測シミュレーションを提供する。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:45:03 GMT)
Adversarial robustness of amortized Bayesian inference [3.3] 償却ベイズ推論は、当初シミュレーションデータ上の推論ネットワークのトレーニングに計算コストを投資することを目的としている。
観測対象のほとんど認識不能な摂動は、予測された後部および非現実的な後部予測標本に劇的な変化をもたらす可能性があることを示す。
本研究では,条件密度推定器のフィッシャー情報をペナライズした計算効率の高い正規化手法を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:18:45 GMT)
Flover: A Temporal Fusion Framework for Efficient Autoregressive Model
Parallel Inference [3.3] Flavorは自己回帰モデルにおける効率的な推論のための時間融合フレームワークである。
NVIDIA Triton FasterTransformerが提供する最先端のソリューションと比較して,GPTモデルの最大11倍高速な推論を実現している。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:43:53 GMT)
An Examination of the Robustness of Reference-Free Image Captioning
Evaluation Metrics [3.3] 字幕のきめ細かい誤りを識別するために,CLIPScoreとUMICの頑健さを評価した。
どちらの指標も、キャプションの不明瞭さに対する感度に制限があり、十分な視覚的接地が欠如していることに対して強い感度を示す。
画像キャプションにおける基準のない評価を改善するための貴重なガイドとして,本研究の成果が期待できる。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:36:12 GMT)
Error Feedback Shines when Features are Rare [3.3] 例えば、$left(colorgreensf GDright)$ with greedy sparsilonleft(colorgreensf TopKright)$ can solve $colorgreensf GD when distributed_xin math_xin bbRd f(x)=frac1nsum_i=1n f_i(x)$。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:52:07 GMT)
High-Throughput AI Inference for Medical Image Classification and
Segmentation using Intelligent Streaming [3.1] 我々は、大規模臨床意思決定のための加速、コスト効率、帯域幅最適化、計算効率の良いAI推論を可能にする最先端のフレームワークを開発する。
分類において、インテリジェントストリーミングはデータ転送を99.01%削減し、復号時間を98.58%削減し、スループットを27.43倍に向上させた。
我々の研究は、インテリジェントストリーミングがより高速なターンアラウンドタイムを実現し、データと送信の全体的なコストを削減し、AIシステムを使用した臨床判断に悪影響を及ぼさないことを示した。
論文参考訳(メタデータ) (Wed, 24 May 2023 23:27:41 GMT)
Polarimetric Imaging for Perception [3.1] 我々は、RGB偏光カメラを用いた知覚タスクの改善の可能性を分析する。
我々は、最先端のディープニューラルネットワークを用いて、両者にとって定量化された改善が達成可能であることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:42:27 GMT)
Structural Ambiguity and its Disambiguation in Language Model Based
Parsers: the Case of Dutch Clause Relativization [3.0] 先行文の存在が相対的節の曖昧さをいかに解決するかを考察する。
その結果、証明ネットに基づくニューロシンボリックは、普遍的な依存関係に基づくアプローチよりも、データ偏差補正に対してよりオープンであることが示された。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:04:18 GMT)
"What if?" in Probabilistic Logic Programming [2.9] ProbLogプログラムは、特定の確率でのみ保持される事実を持つ論理プログラムである。
クエリに答えることによって、このProbLog言語を拡張します。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:35:24 GMT)
Uniform-in-time propagation of chaos for mean field Langevin dynamics [2.7] 平均場ランゲヴィン力学と関連する粒子系について検討する。
エネルギーの関数的凸性を仮定することにより、平均場力学のユニークな不変測度に対する辺分布の$Lp$-収束が得られる。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:27:09 GMT)
Improved Approximations for Extremal Eigenvalues of Sparse Hamiltonians [2.7] 古典的な$/(qk+1)$-approximation for the maximum eigen value of a $k$-sparse fermionic Hamiltonian with strictly $q$-local terms。
より一般に、1/O(qk2)$-approximation for $k$-sparse fermionic Hamiltonians with terms of locality at most $q$。
論文参考訳(メタデータ) (Wed, 24 May 2023 21:28:30 GMT)
CSI-Based Efficient Self-Quarantine Monitoring System Using Branchy
Convolution Neural Network [2.6] そこで我々は,Wi-Fiをベースとしたデバイスフリーの自己検疫監視システムを提案する。
We exploit channel state information (CSI) from Wi-Fi signal as human activity features。
実験の結果,提案モデルでは,5つの異なる人間の活動の分類において,平均98.19%の精度が得られることがわかった。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:02:49 GMT)
Supermodular Rank: Set Function Decomposition and Optimization [2.6] 格子上の函数の超モジュラー階数を定義する。
準モジュラーランクを類似的に定義する。
部分モジュラ分解を用いて集合関数を最適化する。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:09:28 GMT)
Variational Gradient Descent using Local Linear Models [2.6] SVGD(Stein Variational Gradient Descent)は、粒子を軌道に沿って輸送することで、ターゲットと粒子分布の間のKLのばらつきを低減できる。
逆KL勾配流の局所的推定器とみなすSVGDの新しい視点を導入する。
局所線形モデルを用いて同じ目的を達成する新しい推定器を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 21:23:58 GMT)
Distributing circuits over heterogeneous, modular quantum computing
network architectures [2.6] 我々は、ベル状態を介して疎結合な量子コンピューティングモジュールの異種ネットワークを考える。
これらの接続間の操作は計算ボトルネックを構成する。
本稿では,所定の量子回路を,上記型のネットワーク上で実装可能な1つの回路に変換するためのいくつかの手法を紹介する。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:23:13 GMT)
Towards Reliable Misinformation Mitigation: Generalization, Uncertainty,
and GPT-4 [2.5] GPT-4や他の言語モデルは,文献における既存の手法よりも優れていることを示す。
また, GPT-4 と RoBERTa-large は, 故障モードに重大な差異を示し, 大幅な性能改善の可能性が示唆された。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:10:20 GMT)
DuDGAN: Improving Class-Conditional GANs via Dual-Diffusion [2.5] GAN(Generative Adversarial Network)を用いたクラス条件画像生成について,様々な手法を用いて検討した。
本稿では,DuDGANと呼ばれる2次元拡散型ノイズ注入法を取り入れたGANを用いたクラス条件画像生成手法を提案する。
提案手法は,画像生成のための現状条件付きGANモデルよりも性能的に優れている。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:59:44 GMT)
ATLAS: Automatically Detecting Discrepancies Between Privacy Policies
and Privacy Labels [2.5] 自動プライバシラベル解析システム(ATLAS)について紹介する。
ATLASは、モバイルアプリのプライバシーポリシーとプライバシーラベルの相違点を特定する。
平均して、アプリには5.32のコンプライアンス上の問題があることがわかっています。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:27:22 GMT)
BinaryViT: Towards Efficient and Accurate Binary Vision Transformers [2.3] ビジョントランスフォーマー(ViT)は、ほとんどのコンピュータビジョンフィールドの基本的なアーキテクチャとして登場した。
最も強力な圧縮手法の1つとして、バイナライゼーションは、重みとアクティベーション値をpm$1として定量化することにより、ニューラルネットワークの計算を減らす。
既存のバイナライゼーション手法はCNNでは優れた性能を示したが、ViTの完全なバイナライゼーションはまだ未検討である。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:06:59 GMT)
Assessment of Anterior Cruciate Ligament Injury Risk Based on Human Key
Points Detection Algorithm [2.2] 本稿では,コンピュータビジョン技術を用いて検出された人体のキーポイントに基づくACL損傷リスク評価アルゴリズムを提案する。
提案アルゴリズムはACL損傷の潜在的なリスクを効果的に検出する。
論文参考訳(メタデータ) (Wed, 24 May 2023 01:22:26 GMT)
A Deep Generative Model for Interactive Data Annotation through Direct
Manipulation in Latent Space [2.2] ひとつは、グラフィカルユーザインタフェースの座標と、直接操作によるインタラクションのためのニューラルネットワークの潜在空間との類似性に依存している。
本研究は,1) ネットワークトレーニングの反復や勾配を反映する時間と力という2つの新しいアナロジーを提案し,2) 内部構造とユーザが提供するアノテーションの両方を考慮した,データのコンパクトなグラフィカル表現を学習するためのネットワークモデルを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:50:05 GMT)
Detecting and Characterizing Political Incivility on Social Media [2.2] 大規模データセットを用いた最先端のシビリティ検出結果を提案する。
我々は、不合理な政治的言論と反民主的な言論を区別する。
本稿では,ツイート作成者に関するソーシャルコンテキスト情報を,ツイートコンテンツと並行してモデル化するためのアプローチを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:57:12 GMT)
Generative Modeling through the Semi-dual Formulation of Unbalanced
Optimal Transport [2.2] 非平衡最適輸送(UOT)の半二重定式化に基づく新しい生成モデルを提案する。
OTとは異なり、UOTは分散マッチングの厳しい制約を緩和する。このアプローチは、外れ値に対する堅牢性、トレーニング中の安定性、より高速な収束を提供する。
CIFAR-10ではFIDスコアが2.97、CelebA-HQ-256では5.80である。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:31:05 GMT)
An Unsupervised Method for Estimating Class Separability of Datasets
with Application to LLMs Fine-Tuning [2.2] 本稿ではラベルを必要とせずにデータのクラス分離性を推定する教師なし手法を提案する。
本稿では,いくつかのデータセットについて実験を行い,提案手法により推定したクラス分離性の間に明確な相関関係と整合性を示す。
提案手法は,言語モデルの微調整をいつ停止するか,あるいは継続するか,という決定をラベルを使わずに,効果的に支援することができる。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:58:09 GMT)
Physics Constrained Motion Prediction with Uncertainty Quantification [2.1] 物理制約運動予測は、自律的なレーシングデータセットを使用した実験において、ADEが41%、FDEが56%、IoUが19%向上した。
論文参考訳(メタデータ) (Wed, 24 May 2023 00:46:10 GMT)
Modeling Complex Object Changes in Satellite Image Time-Series: Approach
based on CSP and Spatiotemporal Graph [2.0] プロセスは、まず、各画像内のオブジェクトの識別、2番目は、複雑なオブジェクトの変化をモデル化するための時間グラフの構築、3番目は、基本時空間グラフで検出されるサブグラフの作成、4番目は、サブグラフを検出して、関連するCSPグラフを決定するための制約ネットワークを解くことにより、グラフの分析である。
サウジアラビアの複数の都市を対象とした実世界の画像を用いて実験を行い,提案手法の有効性を実証した。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:15:19 GMT)
From Words to Wires: Generating Functioning Electronic Devices from
Natural Language Descriptions [2.0] 現代言語モデルは、コード生成に類似した高レベルのテキスト記述から電子回路設計の能力を有することを示す。
電気部品のモデル知識を評価するPins100と、Arduinoエコシステムにおける一般的なマイクロコントローラ回路とコードの設計能力を評価するMicro25の2つのベンチマークを紹介する。
本研究は,放射線駆動型乱数生成器,絵文字キーボード,可視分光計,いくつかの補助装置など,中程度の複雑なデバイスの設計アシスタントとして言語モデルを使用する6つのケーススタディを含む。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:28:59 GMT)
A Virtual Reality Tool for Representing, Visualizing and Updating Deep
Learning Models [2.0] 我々は、異なるカテゴリにデータ入力を割り当てるプロセスを自動化するバーチャルリアリティーツールを実演する。
データセットは仮想空間内の点の雲として表現される。
ユーザは動きを通して雲を探索し、手のジェスチャーを使って雲の一部を分類する。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:06:59 GMT)
Style Classification of Rabbinic Literature for Detection of Lost
Midrash Tanhuma Material [1.9] 本稿では,そのスタイルに基づいたラビ文学の分類システムを提案する。
そこで,本手法がMidrash Tanhumaから失われた物質の発見にどのように応用できるかを実証した。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:58:05 GMT)
Local SGD Accelerates Convergence by Exploiting Second Order Information
of the Loss Function [1.8] 局所統計勾配勾配(L-SGD)は分散機械学習手法において非常に有効であることが証明されている。
本稿では,L-SGDの強みを理解するための新たな視点を提供する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:54:45 GMT)
Online Optimization for Randomized Network Resource Allocation with
Long-Term Constraints [1.8] 簡単な通信網における最適オンラインリソース予約問題について検討する。
そこで我々は,オンラインサドルポイントアルゴリズムを提案し,関連するK-ベンチマークの後悔に対する上限を提示する。
論文参考訳(メタデータ) (Wed, 24 May 2023 20:47:17 GMT)
High Speed Human Action Recognition using a Photonic Reservoir Computer [1.7] 我々は,「関心の時間」に基づく貯水池コンピュータの新しい訓練方法を提案する。
我々は,複数のビデオストリームをリアルタイムに処理できる点において,高い精度と速度でタスクを解く。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:04:42 GMT)
A Mini Review on the utilization of Reinforcement Learning with OPC UA [1.7] 強化学習(Reinforcement Learning, RL)は、ロボット工学、自然言語処理、ゲームプレイといった様々な分野に応用された強力な機械学習パラダイムである。
この可能性を完全に活用する鍵は、既存の産業システムへのRLのシームレスな統合である。
この研究は、このギャップを埋めるために、両方の技術の技術的な概要を簡潔に提供し、半発掘的な文献レビューを実施している。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:03:48 GMT)
Sound Design Strategies for Latent Audio Space Explorations Using Deep
Learning Architectures [1.6] 変分オートエンコーダ(VAE)と呼ばれるよく知られたディープラーニングアーキテクチャを探索する。
VAEは、記号音楽を除いて、潜時音色空間や潜時音色空間を生成するために使われてきた。
本研究では,VAEを生音声データに直接適用し,音声特徴抽出をバイパスする。
論文参考訳(メタデータ) (Wed, 24 May 2023 21:08:42 GMT)
CoinEM: Tuning-Free Particle-Based Variational Inference for Latent
Variable Models [1.6] 限界最大推定による潜在変数モデル学習のための2つの新しい粒子ベースアルゴリズムを提案する。
1つのアルゴリズムは完全にチューニング不要です。
我々は,複数の高次元設定を含む幅広い数値実験において,アルゴリズムの有効性を検証する。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:03:55 GMT)
Quantifying Character Similarity with Vision Transformers [1.5] 本研究は,OCR文書の文字置換コストを測定する手法を開発した。
視覚変換器(ViT)の大規模な自己教師型トレーニングと拡張デジタルフォントを採用している。
編集距離マッチングアルゴリズムにおいて、文字表現間の余剰距離を置換コストとして用いることにより、レコードリンクが大幅に改善される。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:25:33 GMT)
Feature-aligned N-BEATS with Sinkhorn divergence [1.5] 提案手法は,N-BEATSの2倍の残留積み重ねアーキテクチャを表現学習フレームワークに拡張したものである。
本研究では,提案手法の総合的な実験的評価を行い,モデルの予測と一般化能力を示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:32:23 GMT)
Follower Agnostic Methods for Stackelberg Games [1.5] そこで本稿では,Stackelberg のゲームクラスを従属的な方法で解くアルゴリズムを提案する。
他の現代作品とは異なり、我々のアルゴリズムはリーダーの目的の勾配にオラクル推定器を使わなくてもよい。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:43:37 GMT)
Boundary Attention Mapping (BAM): Fine-grained saliency maps for
segmentation of Burn Injuries [1.4] 火傷は、熱、化学、電気的侮辱などのメカニズムによって引き起こされる。
現在、視覚的および触覚的観察によるバーンアセスメントの主なアプローチは、およそ60%-80%の精度である。
熱傷の重症度を評価するための機械学習パイプラインを導入し、熱傷の影響を受ける皮膚の領域を分割する。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:15:19 GMT)
Promoting Generalization in Cross-Dataset Remote Photoplethysmography [1.4] リモート・フォトプレソグラフィー(Remote Photoplethysmography)は、カメラを使って被験者の心拍数をリモートでモニタリングする手法で、手作りの技法からディープラーニングモデルへと変化してきた。
これらのモデルでは、トレーニングデータセットに固有のパルス波の特徴に対するバイアスを学習する傾向がある。
我々は、トレーニング中にモデルが見る心拍数の範囲と変動率を拡大することにより、学習バイアスを増大させ、モデル収束を改善した。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:35:54 GMT)
Revisiting Signed Propagation for Graph Neural Networks [1.3] 隣接ノードから情報を収集するメッセージパスグラフニューラルネットワーク(GNN)は、ホモ親和性グラフの満足度を達成している。
本稿では,先行理解をマルチクラスシナリオに拡張し,2つの欠点を指摘した。
理論的理解に基づいて,マルチクラスグラフに適用可能な新しい戦略を導入する。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:16:57 GMT)
Wasserstein Gaussianization and Efficient Variational Bayes for Robust
Bayesian Synthetic Likelihood [1.3] ワッサーシュタイン勾配流を用いて要約統計量の分布をガウス分布に変換する。
確率自由問題に対する高効率で信頼性の高いベイズ近似法を開発した。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:42:56 GMT)
Masked Bayesian Neural Networks : Theoretical Guarantee and its
Posterior Inference [1.3] 本稿では,理論特性が良好で,計算可能な新しいノードスパースBNNモデルを提案する。
我々は、真のモデルに対する後部濃度速度が、真のモデルの滑らかさに適応する最小限の最適値に近いことを証明した。
さらに,ノードスパースBNNモデルのベイズ推定を現実的に実現可能な新しいMCMCアルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:16:11 GMT)
Boosting Cross-lingual Transferability in Multilingual Models via
In-Context Learning [1.2] 本稿では,新たな言語間移動促進手法であるIn-CLTを提案する。
我々は,質問応答タスクに着目し,多言語ベンチマークの評価を行う。
実験結果から,In-CLTは多言語モデルの言語間移動性を向上するだけでなく,目立たない言語一般化能力も示している。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:14:49 GMT)
FairShap: A Data Re-weighting Approach for Algorithmic Fairness based on
Shapley Values [1.2] データバリュエーションによる公正なアルゴリズム決定のための新しい前処理(再重み付け)手法であるFairShapを提案する。
さまざまなトレーニングシナリオとモデルで、さまざまな性質の最先端データセットに対して、FairShapを実証的に検証しています。
この研究は、アルゴリズムの公正性に対する解釈可能かつモデルに依存しないアプローチにおける有望な方向性を表していると我々は信じている。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:55:19 GMT)
Have Large Language Models Developed a Personality?: Applicability of
Self-Assessment Tests in Measuring Personality in LLMs [1.1] 言語モデルでパーソナリティを測定するための適切なツールがまだないことを示す。
過去の研究は自己評価人格テストを通じてマシンパーソナリティを評価してきた。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:53:43 GMT)
TaxoKnow: Taxonomy as Prior Knowledge in the Loss Function of
Multi-class Classification [1.1] 本稿では,学習アルゴリズムの損失関数に,階層型分類を明示的正規化器として統合する2つの方法を紹介する。
階層的な分類法により、ニューラルネットワークはクラス上の出力分布を緩和し、少数クラスの上位概念を条件付けする。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:08:56 GMT)
Quantum Rabi interferometry of motion and radiation [1.0] 任意の方向の位相空間変位を推定するためのハイブリッド振動子-量子干渉計構成を提案する。
このようなハイブリッドRabi干渉計を量子センシングに用いて、単一モード推定方式により得られるものよりも性能が優れていることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:55:45 GMT)
Malicious or Benign? Towards Effective Content Moderation for Children's
Videos [1.0] 本稿では,児童ビデオの自動コンテンツモデレーションに関する研究を促進するためのツールキットであるMalicious or Benignを紹介する。
1)ビデオのカスタマイズ可能なアノテーションツール,2)悪意のあるコンテンツのテストケースを検出するのが難しい新しいデータセット,3)最先端のビデオ分類モデルのベンチマークスイートを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 20:33:38 GMT)
Sentiment Analysis Using Aligned Word Embeddings for Uralic Languages [1.0] 本稿では,単語埋め込みを多数言語から4つの少数言語に翻訳する手法を提案する。
さらに、感情分析を行うために、英語データに基づいてトレーニングされた新しいニューラルネットワークモデルを提案する。
我々の研究は、最先端のニューラルモデルが絶滅危惧言語で使用できることを示している。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:40:20 GMT)
FedZero: Leveraging Renewable Excess Energy in Federated Learning [0.9] Federated Learning(FL)は、データ共有なしでデータサイロやエッジデバイス間での分散トレーニングを可能にする、新興の機械学習技術である。
我々は,再生可能エネルギーと計算インフラの予備容量を専ら運用するFLシステムであるFedZeroを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:17:30 GMT)
Distributed Online Rollout for Multivehicle Routing in Unmapped
Environments [0.9] 我々は、よく知られた多車両ルーティング問題に対して、完全に分散し、オンラインでスケーラブルな強化学習アルゴリズムを提案する。
エージェントはローカルクラスタに自己組織化し、各クラスタにローカルにマルチエージェントロールアウトスキームを独立に適用する。
提案アルゴリズムは, 放射半径の2倍と3倍の精度で, 基本方針よりも約2倍のコスト向上を実現している。
論文参考訳(メタデータ) (Wed, 24 May 2023 22:06:44 GMT)
A Comparative Analysis of Techniques and Algorithms for Recognising Sign
Language [0.9] 手話はしばしば、難聴者によるコミュニケーションの第一形態として使われる。
聴覚障害者にソーシャル・プラットフォームを提供するヒューマン・コンピュータ・インタフェース・システムを構築する必要がある。
ほとんどの商用手話翻訳システムはセンサーベースで高価で使いづらい。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:45:24 GMT)
Adaptive Background Music for a Fighting Game: A Multi-Instrument Volume
Modulation Approach [0.9] 本稿では,適応的なBGMを追加することで,DareICEのバックグラウンド音楽(BGM)を強化する取り組みについて述べる。
適応的なBGMは、"Air on G-String"と呼ばれるクラシック曲を演奏する5つの異なる楽器で構成されている。
次に、音声のみを入力として使用する深層強化学習AIを用いて、適応的BGMを評価する実験を行う。
論文参考訳(メタデータ) (Wed, 24 May 2023 00:40:27 GMT)
Linear optics and photodetection achieve near-optimal unambiguous
coherent state discrimination [0.9] 量子電磁場のコヒーレントな状態は、光通信のための情報キャリアとしての主要な候補である。
ここでは、受動多重モード線形光学、位相空間変位、補助真空モード、オンオフ光子検出を許す受信機によるUSDの理論を概説する。
以上の結果から,現在利用可能な光学部品は,複数の多モードコヒーレント状態のほぼ最適不明瞭な識別を実現するのに十分であることが示唆された。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:32:39 GMT)
Block-local learning with probabilistic latent representations [0.8] バックプロパゲーションアルゴリズムは、ネットワークのブロック間でのシーケンシャルな更新を必要とする。
バックプロパゲーションは、更新を計算するために重み行列の転置に依存し、ブロック間で重み輸送の問題を引き起こす。
そこで本稿では,ターゲットから入力への情報を後方に伝播し,局所的な損失を補うツインネットワークを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:11:30 GMT)
Ranger: A Toolkit for Effect-Size Based Multi-Task Evaluation [0.8] Rangerは、NLPおよびIRにおけるマルチタスク評価のためのエフェクトサイズに基づくメタ分析の容易な利用を容易にするツールキットである。
利用可能なRangeツールキットの目標は、ロバストでエフェクトをベースとした評価を促進し、コミュニティにおける評価基準を改善することです。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:38:39 GMT)
Exploring the Grounding Issues in Image Caption [0.7] 本稿では,マルチモーダルな意味表現に関する基礎的課題を,計算的認知言語学的視点から考察する。
Flickr30kデータセットの画像に注釈を付け,そのキャプションの探索的分析と統計的モデリングを行った。
論文参考訳(メタデータ) (Wed, 24 May 2023 01:30:50 GMT)
Quantum complexity phase transitions in monitored random circuits [0.7] 監視されたランダム回路における量子状態複雑性のダイナミクスについて検討する。
正確な量子状態の複雑性の進化は、測定率を変更する際に相転移を起こす。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:00:11 GMT)
Fantastic DNN Classifiers and How to Identify them without Data [0.7] トレーニング済みのDNN分類器の品質をサンプルデータなしで評価できることを示す。
1つはプロトタイプの特徴を用いており、もう1つはプロトタイプに対応する逆例を用いている。
実験により, 試験例から得られた精度は, 提案した指標から得られた品質指標と直接的に比例することを示した。
論文参考訳(メタデータ) (Wed, 24 May 2023 20:54:48 GMT)
Relating Implicit Bias and Adversarial Attacks through Intrinsic
Dimension [0.7] 敵の攻撃は モデルを騙すように設計された 入力データの小さな摂動だ
我々は、ニューラルネットワークの暗黙の偏見に焦点を当て、特定のパターンや結果を支持するために、その固有の傾きを参照する。
固有次元と相関関係の絡み合いを利用して、フーリエ空間におけるネットワークバイアスと敵攻撃の標的周波数が密接な結びつきを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:40:23 GMT)
Emergent inabilities? Inverse scaling over the course of pretraining [0.6] 本研究は,訓練期間を通じて,一般的な性能を維持しながら,特定のタスクにおける言語モデルの性能が低下するか否かを考察する。
逆スケーリングチャレンジの2つのタスク – 引用-繰り返しと再定義-マス – に対して,これは事実です。
これは、たとえ全体的なパフォーマンスが改善したとしても、追加データでトレーニングされるたびに、すべての関連するベンチマークでモデルパフォーマンスをテストすることの重要性を強調します。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:42:43 GMT)
On the Minimax Regret for Online Learning with Feedback Graphs [0.6] 強く観察可能な無向フィードバックグラフを用いて,オンライン学習を後悔する上で,上層と下層の境界を改善した。
改良された上界$mathcalObigl(sqrtalpha T(ln K)/(lnalpha)bigr)$ hold for any $alpha$ and the lower bounds for bandits and experts。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:40:57 GMT)
A DNN Framework for Learning Lagrangian Drift With Uncertainty [0.6] ラグランジュの漂流の復元、例えば海で失われた物体は、しばしばデータの中で未解決の物理的現象のために不確実である。
フレキシブルな環境で確率的ドリフトをモデル化するための、純粋にデータ駆動のフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:39:40 GMT)
A Distributed Automatic Domain-Specific Multi-Word Term Recognition
Architecture using Spark Ecosystem [0.5] ドメイン固有の用語を自動的に抽出する分散Sparkベースのアーキテクチャを提案する。
2つの実世界のデータセットで実験を行うことで、アーキテクチャの実現性を実証的に証明する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:05:59 GMT)
Artificial Intelligence-Based Methods for Precision Medicine: Diabetes
Risk Prediction [0.3] このスクーピングレビューは、T2DMリスク予測のためのAIベースのモデルに関する既存の文献を分析する。
従来の機械学習モデルは、ディープラーニングモデルよりも一般的だった。
単調モデルとマルチモーダルモデルの両方が有望な性能を示し、後者は前者を上回った。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:45:54 GMT)
Fulling-Davies-Unruh effect for accelerated two-level single and
entangled atomic systems [0.3] 空き空間内および空き空間内における一様加速2レベル原子と絡み合った原子系の遷移速度について検討した。
2つの原子系について、この系は当初、純粋な絡み合った状態に準備されているとみなす。
極端に絡み合った超ラジカル初期状態には遷移は起こらない。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:39:40 GMT)
Quantitative Relations Between Different Measurement Contexts [0.3] 量子論において、測定コンテキストは、それぞれの基底ベクトルが特定の測定結果を表すヒルベルト空間の基底によって定義される。
ここでは、異なる文脈で共有される測定結果を用いて、ヒルベルト空間ベクトルの内部積の間の特定の量的関係を導出する。
2つの系の積空間への解析の適用により、量子エンタングルメントの非局所性は局所的な内積に遡ることができることが明らかになった。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:26:09 GMT)
A Fair and In-Depth Evaluation of Existing End-to-End Entity Linking
Systems [0.3] 既存のエンティティリンクシステムの評価では、システムが特定のアプリケーションに対してどのように機能するかはほとんど語られません。
既存のさまざまなエンド・ツー・エンド・エンティティ・リンカについて,より有意義で公平な評価を行う。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:20:15 GMT)
Multiclass classification for multidimensional functional data through
deep neural networks [0.2] 革新的なデータマイニング分類ツールとして,新しい機能深層ニューラルネットワーク(mfDNN)を導入する。
線形単位(ReLU)アクティベーション機能を持つ疎いディープニューラルネットワークアーキテクチャを考察し,マルチクラス分類設定におけるクロスエントロピー損失を最小化する。
シミュレーションデータと異なるアプリケーションドメインのベンチマークデータセットにおけるmfDNNの性能を示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:02:42 GMT)
Logic of Differentiable Logics: Towards a Uniform Semantics of DL [0.2] 論理的仕様を満たすためにニューラルネットワークを訓練する方法として、微分論理(DL)が提案されている。
本稿では、微分可能論理学(LDL)と呼ばれるDLを定義するメタ言語を提案する。
我々は,既存のDLの理論的特性を確立するためにLDLを使用し,ニューラルネットワークの検証において実験的な研究を行う。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:33:37 GMT)
Mediapipe and CNNs for Real-Time ASL Gesture Recognition [0.2] 本稿では,アメリカ手話(ASL)の動きをリアルタイムに識別するシステムについて述べる。
提案手法は,特徴抽出のためのMediapipeライブラリと,ASLジェスチャー分類のための畳み込みニューラルネットワーク(CNN)を利用する。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:48:01 GMT)
Exploring Sentiment Analysis Techniques in Natural Language Processing:
A Comprehensive Review [0.2] 感性分析(英: Sentiment Analysis、SA)は、テキストによる感情の検出と理解を自動化するプロセスである。
SAは自然言語処理(NLP)の分野で大きな人気を集めている。
本研究の目的は,SAプロセスの効率性と精度の向上であり,よりスムーズでエラーのない結果をもたらすことである。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:48:41 GMT)
Wafer-scale magnesium diboride thin films and devices with tunable high
kinetic inductance [0.0] 成熟したデバイス製造過程を報告し、フィルムの特性を測定するための試験構造を実証する。
これには、4.5Kで$mathrm104$以上の内部Q因子を持つ共振器と、40nmフィルムで容易に達成できる高い運動インダクタンス(5-50 pH/$square$)が含まれる。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:28:58 GMT)
What happens to entropy production when conserved quantities fail to
commute with each other [0.0] エントロピー生成を非可換量を含む深い量子状態に拡張する。
エントロピー生成に対する電荷の非可換性の異なる物理効果を定量化する。
この研究は非可換電荷、特に量子電荷に熱力学を開放する。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:02:26 GMT)
What functions can Graph Neural Networks compute on random graphs? The
role of Positional Encoding [0.0] 我々は,グラフニューラルネットワーク(GNN)の大規模グラフに対する理論的理解を深めることを目指しており,その表現力に着目している。
近年、GNNは、非常に一般的なランダムグラフモデルにおいて、ノード数が増加するにつれて、特定の関数に収束することを示した。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:09:53 GMT)
Using the Uniqueness of Global Identifiers to Determine the Provenance
of Python Software Source Code [0.0] 本稿では,フリー/オープンソースソフトウェア(FOSS)の出現点と,再利用ソースコードのコピー先を特定する必要性について考察する。
本稿では,プログラマが選択した変数,クラス,関数の名前など,ソフトウェア識別子に基づく問題を解決するための軽量なアプローチを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:42:11 GMT)
Universal limit on spatial quantum superpositions with massive objects
due to phonons [0.0] 宇宙量子重ね合わせは、これまで小さなシステムでしかテストされていない。
巨大な物体に対するそのような重ね合わせは、長い間望まれてきた目標であった。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:13:05 GMT)
Trends and Challenges Towards an Effective Data-Driven Decision Making
in UK SMEs: Case Studies and Lessons Learnt from the Analysis of 85 SMEs [0.0] Data Scienceは中小企業をサポートし、生産プロセスを最適化し、顧客のニーズを予測し、機械の故障を予測し、効率的なスマートサービスを提供する。
データサイエンスの決定を中小企業に統合するには、スキルとIT投資の両方が必要です。
本稿では,85の中小企業を対象としたケーススタディに基づいて,組織における効果的なデータ駆動意思決定に向けた動向と課題について述べる。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:23:32 GMT)
Transient and steady-state quantum chaos in driven-dissipative bosonic
systems [0.0] 我々は、駆動散逸型オープン量子システムにおける量子カオスを特徴づけるための基準を導入する。
境界駆動散逸型Bose-Hubbard鎖における量子カオスの研究に本手法を適用した。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:00:22 GMT)
ToMChallenges: A Principle-Guided Dataset and Diverse Evaluation Tasks
for Exploring Theory of Mind [0.0] 心の理論 (Theory of Mind, ToM) とは、異なる個人の精神状態を理解する能力である。
これまでの研究では、大きな言語モデルでToMをテストするために、さまざまなタスクとプロンプトを使用してきた。
本稿では、Sally-Anne と Smarties のテストに基づいて、心の理論を評価するデータセットであるToMChallengesを紹介する。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:54:07 GMT)
Timeseries-aware Uncertainty Wrappers for Uncertainty Quantification of
Information-Fusion-Enhanced AI Models based on Machine Learning [0.0] 時系列データに対する信頼性の高い不確実性推定のための時系列認識型不確実性ラッパーを提案する。
本研究では,情報融合によるモデル精度の向上と,不確実性推定の品質向上が可能であることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:24:54 GMT)
Thinking Twice: Clinical-Inspired Thyroid Ultrasound Lesion Detection
Based on Feature Feedback [0.0] 本稿では,臨床診断にインスパイアされた特徴フィードバック機構に基づく新しい検出ネットワークを提案する。
提案手法は, 甲状腺超音波データセットのAPが70.3%, AP50が99.0%であり, リアルタイム要件を満たしている。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:07:46 GMT)
Theory of Edge Effects and Conductunce for Applications in
Graphene-based Nanoantennas [0.0] 我々は、グラフェンのエッジ効果の理論を開発し、テラヘルツ、赤外、可視域のナノアンテナに応用した。
表面コンダクタンスの空間的挙動は、シートの長さと電気化学的ポテンシャルに依存する。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:27:43 GMT)
Theorem Proving in Dependently-Typed Higher-Order Logic -- Extended
Preprint [0.0] 高階論理 HOL は、型付きデータ構造を表現および推論するための非常に単純な構文と意味論を提供します。
依存型理論はそのようなリッチな型システムを提供するが、HOLとはかなり概念的な違いがある。
本稿では,HOLのスタイルと概念的枠組みを維持した,依存型拡張DHOLを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:40:54 GMT)
The Impact of Socioeconomic Factors on Health Disparities [0.0] 我々は米国国勢調査とCDCのデータを用いて、特定の社会経済的要因が特定の健康指標と一般的な健康指標とどのように関連しているかを調査した。
以上の結果から,収入や教育達成率などの社会経済的要因は,総合的な健康対策と高い相関があることが示唆された。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:16:42 GMT)
Taylor Learning [0.0] 経験的リスク最小化は、教師付き機械学習におけるほとんどの最適化の背後にある。
本稿では,勾配降下や経験的リスク最小化を用いない実解析関数モデルを構築するための学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 01:10:58 GMT)
Synchronized Bell protocol for detecting non-locality between modes of
light [0.0] ベルプロトコルにおける2モードの光状態における非局所性検出の可能性について論じる。
変位の位相が未知の場合,非局所性は検出できないことを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:55:01 GMT)
Symplectic model reduction of Hamiltonian systems using data-driven
quadratic manifolds [0.0] この研究は、高次元ハミルトニアン系のシンプレクティックモデル還元のための2つの新しいアプローチを示す。
最近開発された二次多様体に基づく2つの異なるモデル還元法を提案する。
提案手法の中心に位置する状態近似における二次項の追加により、手前の問題における本質的な低次元性を表現することができる。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:23:25 GMT)
Sweet-spot operation of a germanium hole spin qubit with highly
anisotropic noise sensitivity [0.0] クビット駆動とデコヒーレンスを弱体化させる機構と異方性について報告する。
低磁場でキュービットを動作させ、99.94 %の単一キュービットゲート密度を維持しながら、T*=9.2$mu$sの劣化時間を測定する。
この量子ビット駆動とデコヒーレンス機構の理解は、スケーラブルで高コヒーレントなホール量子ビットアレイの設計と運用の鍵となる。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:24:57 GMT)
Superdiffusion from nonabelian symmetries in nearly integrable systems [0.0] ハイゼンベルクスピン鎖は正準可積分モデルである。
スピン輸送は非ゼロ温度で準弾道的である。
2モードの流体力学記述は、相関関数のKPZスケーリングと完全なカウント統計の粗い特徴の両方をキャプチャする。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:00:00 GMT)
Streaming Object Detection on Fisheye Cameras for Automatic Parking [0.0] 本稿では,未来を予測し,時間ラグ問題を緩和するデュアルフロー認識モジュールを備えたリアルタイム検出フレームワークを提案する。
標準バウンディングボックスは、魚眼カメラの強い半径歪みのため、魚眼カメラ画像の物体には適さない。
本稿では,物体の簡易かつ高精度な表現法であるボックスの角度を回帰する新しい周期的角度損失関数を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:30:25 GMT)
Statistical post-processing of visibility ensemble forecasts [0.0] 局所的,半局所的,局所的に訓練された比例確率対数回帰(POLR)と多層パーセプトロン(MLP)ニューラルネットワーク分類器の予測性能について検討した。
気候学的な予測は生のアンサンブルを広いマージンで上回るが、後処理により予測スキルが大幅に向上することを示した。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:41:36 GMT)
Spin operator, Bell nonlocality and Tsirelson bound in quantum-gravity
induced minimal-length quantum mechanics [0.0] スピン作用素は最小長の量子力学における運動量依存的な寄与を得ることを示す。
この修正は、通常の量子力学で生じるものよりも強い量子非局所性の形式を誘導する。
論文参考訳(メタデータ) (Wed, 24 May 2023 23:04:40 GMT)
Semantic Segmentation by Semantic Proportions [0.0] そこで本研究では,地層構造分割マップの必要性を排除し,セマンティックセマンティックセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなアプローチを提案する。
我々のアプローチでは、個々の意味クラス比率の粗い情報のみを必要とし、セマンティック比例として短縮される。
データアノテーションプロセスを大幅に単純化し、アノテーションの時間とコストを大幅に削減します。
論文参考訳(メタデータ) (Wed, 24 May 2023 22:51:52 GMT)
Selection for short-term empowerment accelerates the evolution of
homeostatic neural cellular automata [0.0] 本研究は, ホメオスタティックNCAの発見を促進するための補助的目的として, エンハンスメントの作用する時間スケールが有効性に与える影響を考察する。
ホメオスタシスのみの進化的選択と比較して,より長い遅延時間でエンパワーメントが大幅に改善されることが示唆された。
短期的なNCAはより安定しており, ホームスタティックな課題を克服する上で, より優れた一般化が期待できる。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:01:30 GMT)
Scale Matters: Attribution Meets the Wavelet Domain to Explain Model
Sensitivity to Image Corruptions [0.0] 本稿では,WCAM(Wavelet sCale Attribution Method)を紹介し,画素領域から空間スケール領域への属性の一般化について述べる。
我々は,WCAMが画像の破損下でのモデルの故障を説明し,予測に十分な情報を特定し,ズームインが精度を高める方法を説明する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:13:32 GMT)
Robustness of Quantum Random Walk Search Algorithm in Hypercube when
only first or both first and second neighbors are measured [0.0] ハイパーキューブにおける量子ランダムウォーク探索アルゴリズムの2つの修正のロバスト性について検討する。
最も重要なことは、ロバスト性の観点から、特に大きなコイン次元において、アルゴリズムの安定性が増大することである。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:55:52 GMT)
Regularization Through Simultaneous Learning: A Case Study for Hop
Classification [0.0] ディープニューラルネットワークにおいて、オーバーフィッティングは依然として一般的な課題であり、最適化された現実世界のパフォーマンスにつながる。
本稿では,トランスファーラーニングとマルチタスクラーニングの原則に基づく新しい正規化手法である同時学習を提案する。
提案手法は,目的のデータセットと相乗効果の補助的データセットのパワーを利用して,高度に関連性の高い特徴の獲得を増幅する。
論文参考訳(メタデータ) (Wed, 24 May 2023 01:54:33 GMT)
Reducing Rydberg state dc polarizability by microwave dressing [0.0] セシウム原子Rydberg状態のdc偏光率の減少をマイクロ波電場ドレッシングを用いた77K環境下で実証した。
その結果、表面近傍に存在する様々なdc磁場に対するリドバーグ共鳴の安定化に寄与し、ハイブリッドリドバーグ原子 - 超伝導共振器量子ゲートの開発が進展する。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:35:57 GMT)
Real time dense anomaly detection by learning on synthetic negative data [0.0] 差別的予測のクロスエントロピーに応じて同じ共有表現を最適化する最近のハイブリッド手法について考察する。
我々は、この処理を、不整合分布の境界における合成陰性をサンプリングする、共同で訓練された生成フローで拡張する。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:09:41 GMT)
Radial power-like potentials: from the Bohr-Sommerfeld $S$-state
energies to the exact ones [0.0] $d$次元ラジアルSchr"odinger方程式の$S$状態に対するB-S量子化条件を提案する。
提案したB-S条件の正しさは、様々な次元に対して$d$である。
論文参考訳(メタデータ) (Wed, 24 May 2023 04:23:25 GMT)
Quantum turnstiles for robust measurement of full counting statistics [0.0] 実験やテンソルネットワークシミュレーションにおいて,FCS(Full counting statistics)を測定するためのスケーラブルなプロトコルを提案する。
量子ガス顕微鏡とは異なり、ターンタイルプロトコルは数不定初期状態から始まるFCSを忠実に捉えている。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:00:00 GMT)
Quantum chaos in the Dicke model and its variants [0.0] 我々は、オープン量子システム設定において、ディックモデルの異なるバリエーションに対して、時間外順序付き相関器(OTOC)を計算する。
これは、量子光学モデルにおけるOTOCと量子カオスの実験的研究において重要である。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:53:33 GMT)
Optimal Generators for Quantum Sensing [0.0] 与えられた量子状態を用いた最大感度は、量子フィッシャー情報行列(QFIM)の最大固有値によって決定されることを示す。
状態準備プロトコルに焦点をあてるのではなくパラメータ符号化のプロセスを最適化するため、我々の手法はあらゆる量子センサに関係している。
論文参考訳(メタデータ) (Wed, 24 May 2023 20:42:38 GMT)
Optical self-cooling of a membrane oscillator in a cavity optomechanical
experiment at room temperature [0.0] 熱ノイズは、マクロ系における量子の振る舞いを観測する大きな障害である。
レーザー源の過度な古典的ノイズにより, 余分な冷却が防止されることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:56:23 GMT)
Operator learning with PCA-Net: upper and lower complexity bounds [0.0] PCA-Netは、ニューラルネットワークの主成分分析と無限次元関数空間間の近似演算子を組み合わせた、最近提案されたニューラルネットワークアーキテクチャである。
基礎となる演算子とデータ生成分布について最小限の仮定の下で、新しい普遍近似結果が導出される。
PCA-Netは、ダーシー流とナビエ・ストークス方程式から生じる特定の興味を持つ作用素に対する次元性の一般的な呪いを克服することができる。
論文参考訳(メタデータ) (Wed, 24 May 2023 20:56:56 GMT)
On the road to more accurate mobile cellular traffic predictions [0.0] 我々は、セル上の短期的な将来の負荷を予測するために、ハイウェイフローと平均速度変数とセルネットワークトラフィックメトリクスを併用する。
これは、主に都市のシナリオを研究する先行技術とは対照的である。
学習構造は、セルまたはエッジレベルで使用することができ、フェデレーション付き学習と集中型学習の両方に適用できる。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:18:46 GMT)
On the properties of Gaussian Copula Mixture Models [0.0] 本稿では,GCMMの数学的定義を示し,その可能性関数の性質について検討する。
本論文では,コプラの混合に対するパラメータを推定するための拡張期待アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 01:41:38 GMT)
On the Relativistic Spatial Localization for massive real scalar
Klein-Gordon quantum particles [0.0] D.R.Ternoによって導入されたKlein-Gordon大質量実粒子の空間的局在に関する提案を厳密に分析する。
これらのPOVMは、実際にニュートン・ウィグナーのPVMのキネマティックな変形であることを示す。
完全なカスティーリャーノの因果関係要件の妥当性は、テルノの因果関係を自然な方法で一般化する空間的局所化の概念にも証明される。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:59:48 GMT)
On the Origin of Time's Arrow in Quantum Mechanics [0.0] 時間矢印は量子力学的進化によって生成されることを示す。
極限$cal N rightarrow infty$ では、矢は時間の歯によって固定される。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:00:02 GMT)
Offline Reinforcement Learning with Additional Covering Distributions [0.0] 我々は,関数近似を用いて,ログ化されたデータセット,すなわちオフラインRLから最適ポリシーを学習する。
一般のMDPに対するサンプル効率のよいオフラインRLは、部分的カバレッジデータセットと弱い実現可能な関数クラスだけで実現可能であることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:25:31 GMT)
Observers in superposition and the no-signaling principle [0.0] ウィグナーの友人実験(Wigner's friend experiment)は、いわゆるスーパーオブザーバーが別の観察者を観察する思考実験である。
この設定では、ウィグナーは友人のシステムと、友人の計測に関わる他の自由度を1つのジョイント量子システムとして扱う。
このような変更の友人による認識は、変更に関する情報を格納する追加のメモリレジスタによってモデル化でき、無署名状態と矛盾することを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:37:15 GMT)
Non-adversarial Robustness of Deep Learning Methods for Computer Vision [0.0] 非敵対的ロバスト性(英: non-adversarial robustness)、あるいは自然ロバスト性(英: natural robustness)は、ディープラーニングモデルの特性である。
本稿では,コンピュータビジョン手法のロバスト性向上のための最新の技術の概要を紹介する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:21:31 GMT)
Non-Gaussian dynamics of quantum fluctuations and mean-field limit in
open quantum central spin systems [0.0] 中心スピンが選択され、他の全ての浴室スピンと非局所的に相互作用する量子スピン系を研究する。
我々の研究は、中心スピン系の異なる力学状態の基本的な理解を提供する。
これは一般に開量子多体系に関係しうる非平均場理論を強調している。
論文参考訳(メタデータ) (Wed, 24 May 2023 20:23:31 GMT)
Non-Asymptotic Lower Bounds For Training Data Reconstruction [0.0] 本研究は,データ再構築攻撃の訓練に対するレジリエンスを調査し,私的学習者が与える保護の厳密な評価を提示する。
我々は、コンパクトな距離空間に属する対象標本に対して、$(epsilon, delta)$微分プライベートな学習者に対して、任意の敵によって引き起こされる再構成誤差の漸近的でない下限を導出した。
我々は,入力データ次元が敵のクエリ予算よりも大きい場合の高次元状態をカバーするために解析を拡張し,その限界が一定の条件下で最適であることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 21:44:52 GMT)
Neural-network-designed three-qubit gates robust against charge noise
and crosstalk in silicon [0.0] 我々は物理インフォームドニューラルネットワークを数値的に最適化し、トフォリ等価ゲートを生成する理論的に頑健な形状のパルスを生成する。
頑健なパルスは、非ローブストパルスの10倍のmVではなく、数mVの電圧における平均準静的なゆらぎに対して10〜3ドルの不完全性を維持する。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:28:25 GMT)
Music Representing Corpus Virtual: An Open Sourced Library for
Explorative Music Generation, Sound Design, and Instrument Creation with
Artificial Intelligence and Machine Learning [0.0] Music Representing Corpus Virtual (MRCV) は、音楽生成、サウンドデザイン、仮想機器作成(MGSDIC)における人工知能(AI)と機械学習(ML)の能力を探求するオープンソースソフトウェアスイートである。
MRCVの主な目的は、創造性を促進することであり、ユーザーはニューラルネットワークをトレーニングするための入力データセットをカスタマイズし、ニューラルネットワーク毎にさまざまなオプションを提供することができる。
ソフトウェアはオープンソースであり、ユーザーは開発に貢献でき、コミュニティは他のユーザの洞察や経験から一括して恩恵を受けることができる。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:36:04 GMT)
Multimodal Automated Fact-Checking: A Survey [0.0] 我々は、自動ファクトチェック(AFC)のためのフレームワークを概念化する。
実世界のファクトチェックで一般的な4つのモダリティ(テキスト、画像、オーディオ、ビデオ)に焦点を当てる。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:26:07 GMT)
Multi-State RNA Design with Geometric Multi-Graph Neural Networks [0.0] gRNAdeは3D RNAのバックボーン構造を利用し、その設計におけるRNAコンフォメーションの多様性を考慮し、反映している。
大規模3次元RNA設計データセットを用いた単一状態アプローチによるネイティブシークエンスリカバリ改善のためのgRNAdeの有用性を実証する。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:46:56 GMT)
Multi-Agent Reinforcement Learning with Common Policy for Antenna Tilt
Optimization [0.0] 本稿では,セルパラメータの調整による無線ネットワークの最適化手法を提案する。
エージェントは共通の方針を共有し、近隣の細胞からの情報を考慮し、状態と報酬を決定する。
提案手法は,すでに専門家のシステムベースの手法によって提供された性能向上を著しく改善することを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:24:04 GMT)
Measurement-induced multipartite-entanglement regimes in collective spin
systems [0.0] スピン-1/2粒子のアンサンブルの力学における集団一般化測定と相互作用誘起スクランブルの競合効果について検討した。
集合的ユニタリダイナミクスと測定値の相互作用が平均的な量子フィッシャー情報の3つの状態に繋がることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:27:19 GMT)
Machine Unlearning: its nature, scope, and importance for a "delete
culture" [0.0] 本稿では,デジタル時代における記録から情報削除への文化的変化について考察する。
このコンテキストでは、削除、情報の入手不能化、アクセス不能化の2つの戦略に焦点を当てている。
マシン・アンラーニング(MU)の新たな研究領域は潜在的な解決策として強調されている。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:27:04 GMT)
Low-Variance Forward Gradients using Direct Feedback Alignment and
Momentum [0.0] ディープニューラルネットワーク(DNN)における教師付き学習は、一般的にエラーバックプロパゲーション(BP)アルゴリズムを用いて行われる。
BPの代替品を見つけることへの関心が高まっている。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:41:34 GMT)
Learning t-doped stabilizer states [0.0] 非クリフォードゲートの有限個のtをドープしたクリフォード回路を用いて,計算ベース状態から得られる学習状態を対象とした学習アルゴリズムを提案する。
このアルゴリズムは複雑さのリソースである$O(exp(t)poly(n))$を必要とし、指数関数的に小さな失敗の確率を示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:57:10 GMT)
Kinetic inductive mechano-electric transduction for nano-scale force
sensing [0.0] 我々はキャビティオプティメカニクスの原理を用いて原子間力顕微鏡のための共鳴機械力センサを設計する。
このセンサーは、従来の静電容量結合と二重の、新しいタイプの電気機械結合に基づいている。
多周波ポンピングと測定手法を用いて, キャンチレバーの位相感度検出を実証した。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:18:48 GMT)
Is Your Model "MADD"? A Novel Metric to Evaluate Algorithmic Fairness
for Predictive Student Models [0.0] 本稿では,モデルの識別行動を分析するために,モデル絶対密度距離(MADD)を提案する。
オンライン授業における学生の成功を予測するための共通課題に対するアプローチを,いくつかの共通予測分類モデルを用いて評価した。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:55:49 GMT)
InterFormer: Interactive Local and Global Features Fusion for Automatic
Speech Recognition [0.0] 局所的・大域的特徴は自動音声認識(ASR)に不可欠である
本稿では,対話型ローカル・グローバル機能融合のためのInterFormerを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:43:44 GMT)
Highly over-parameterized classifiers generalize since bad solutions are
rare [0.0] 学習のための経験的リスク最小化(ERM)は、トレーニングエラーをゼロにする。
ある条件下では、エプシロンよりも大きい真の誤差を持つ「悪い」大域最小値の分数は、訓練データ n の個数で指数関数的にゼロになる。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:20:49 GMT)
Guessing Winning Policies in LTL Synthesis by Semantic Learning [0.0] 合成問題から派生したパリティゲームにおいて,勝利戦略を推測する学習に基づく手法を提案する。
ゲームの大きさが厳密なアプローチを禁止している場合に、予想される戦略を最善策として適用できるだけでなく、厳密な合成のスケーラビリティをいくつかの方法で向上させることもできる。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:57:53 GMT)
Grid-SiPhyR: An end-to-end learning to optimize framework for
combinatorial problems in power systems [0.0] SiPhyRは物理インフォームド機械学習フレームワークで、エンドツーエンドの学習で問題解決を最適化する。
クリーンエネルギーシステムの新たなパラダイムにおけるSiPhyRの有効性を実証する。
論文参考訳(メタデータ) (Wed, 24 May 2023 21:27:45 GMT)
Generative Adversarial Shaders for Real-Time Realism Enhancement [0.0] 機械学習技術をリアルタイムアプリケーションに適用する,高性能で生成可能なシェーダベースアプローチを提案する。
提案した学習可能なシェーダパイプラインは、エンドツーエンドでトレーニング可能な微分可能な関数から構成される。
パイプラインはターゲットデバイス上での高効率な実行に最適化されており、時間的に安定し、より高速なリアルタイム結果を提供する。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:42:38 GMT)
General ordering theorem [0.0] 一般順序理論(GOT)を証明し,任意の順序のペア間の関係を確立する。
一般(演算的)可換関係を満たす作用素に作用することを示す。
注目すべきことに、この定理はこれらの2つの定理の間の公式な関係を確立し、現在知られている悪名高い複雑な定理とは異なり、それらに対してコンパクトな表現を提供する。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:07:14 GMT)
First detection probability in quantum resetting via random projective
measurements [0.0] 一般量子系における「興味のある状態」の最初の検出時間の確率分布を$F_r(t)$で計算する。
F_r(t)sim t2$ が$p(0)ne 0$ であることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:15:01 GMT)
Fast Adversarial CNN-based Perturbation Attack on No-Reference Image-
and Video-Quality Metrics [0.0] 非参照品質指標に対する高速な敵攻撃を提案する。
提案した攻撃は、リアルタイムビデオ処理および圧縮アルゴリズムにおける前処理ステップとして利用することができる。
この研究は、安定したニューラルネットワークベースの非参照品質メトリクスの設計にさらなる支援を与えることができる。
論文参考訳(メタデータ) (Wed, 24 May 2023 20:18:21 GMT)
Extracting Psychological Indicators Using Question Answering [0.0] 本稿では,BIG5の心理的特徴の1つを示すテキストスパン抽出手法を提案する。
我々はSQuAD 2.0データセットを微調整したRoBERTaモデルを利用した。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:41:23 GMT)
Experimental Verification of Many-Body Entanglement Using Thermodynamic
Quantities [0.0] 熱力学量を測定することで容易に検証できるマルチキュービットシステムの絡み合い基準セットを提案する。
原理の証明として、最大10キュービットの核スピンレジスタに関する熱力学的基準を提案する。
また、多体システムにおいて、状態に関する知識が部分的に、あるいは全くない場合にのみ、エレガントなエンタングルメント認証を提供する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:52:35 GMT)
Entanglement entropy production in Quantum Neural Networks [0.0] 量子ニューラルネットワーク(QNN)は、ノイズ中間量子コンピュータ(NISQ)時代に量子優位性を達成するための候補と考えられている。
任意のQNNアーキテクチャにおいて、絡み合いが生成される速度に対して、普遍的な振舞いを示す。
本稿では,QNNにおける絡み合い生成を特徴付ける新しい指標として,絡み合いの速度について紹介する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:21:50 GMT)
Entanglement and geometry from subalgebras of the Virasoro algebra [0.0] エネルギー密度と絡み合いエントロピーを導出し、局所励起状態で計算された類似量と等価性について議論する。
また, 2つのホログラフィックな地形を解析し, 龍高柳処方薬のエンタングルメントエントロピーを再現した。
論文参考訳(メタデータ) (Wed, 24 May 2023 02:22:09 GMT)
Embedding Contextual Information through Reward Shaping in Multi-Agent
Learning: A Case Study from Google Football [0.0] 我々は、報酬関数に文脈情報を埋め込むことで、新たな報酬形成手法を作成する。
Google Research Football (GRF) 環境でこれを実証する。
実験結果から,報奨信号の少ない環境下でのトレーニングエージェントのための最新のMARLアルゴリズムに,報奨形法が有用であることが確認された。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:57:57 GMT)
EXnet: Efficient In-context Learning for Data-less Text classification [0.0] 本報告では,実例数に制限を加えることなく,文脈内学習を実現するためのモデルであるEXnetを提案する。
テキスト内学習はタスクの精度を高めるための効果的な手法であり,実例を提供することでタスク間の一般化が促進される,と我々は主張する。
大規模な実験により、我々の最小のモデル(15Mパラメータ)でさえ、いくつかの目に見えない分類タスクや領域に一般化できることが示される。
論文参考訳(メタデータ) (Wed, 24 May 2023 01:40:57 GMT)
Dynamical Symmetries of the H Atom, One of the Most Important Tools Of
Modern Physics: SO(4) to SO(4,2), Background, Theory, and Use in Calculating
Radiative Shifts [0.0] 水素原子を理解することは、原子物理学、量子力学、量子電磁力学、素粒子物理学の進歩につながった。
本稿では,シュロディンガー水素原子の対称性を総合的に検討する。
学生、非専門家、そして新世代の科学者は、水素原子の対称性のより明確で統合されたプレゼンテーションを見つけることができるかもしれない。
論文参考訳(メタデータ) (Wed, 24 May 2023 22:58:01 GMT)
Dynamic Borrowing Method for Historical Information Using a Frequentist
Approach for Hybrid Control Design [0.0] 本稿では,現在と過去のデータとの類似性に基づく,歴史的情報の動的借入手法を提案する。
本研究では,実際の臨床試験データを再解析し,借用情報の有用性を実証する。
論文参考訳(メタデータ) (Wed, 24 May 2023 03:38:26 GMT)
Drivers of Mobile Payment Acceptance: The Impact of Network
Externalities [0.0] この研究は、モバイル支払いの受け入れの主要な要因は、パフォーマンスの期待、努力の期待、社会的影響、信頼、ネットワーク外部性である、と仮定している。
調査の結果は、従来のドライバーは依然としてモバイル決済を採用する顧客の意思に影響を与えているが、ネットワーク外部性は最も強い影響を持っていることを示唆している。
論文参考訳(メタデータ) (Wed, 24 May 2023 19:10:33 GMT)
Dopant-assisted stabilization of negatively charged single
nitrogen-vacancy centers in phosphorus-doped diamond at low temperatures [0.0] 電荷状態不安定性は固体スピン系の実装のボトルネックとなっている。
ここでは, 負電荷の窒素空孔中心の液体ヘリウム温度における安定化について検討する。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:53:10 GMT)
Detection of Non-uniformity in Parameters for Magnetic Domain Pattern
Generation by Machine Learning [0.0] 磁区の小さな部分領域ウィンドウ内のパターンからパラメータを推定し,物理パラメータの空間マップを得る手法を提案する。
我々は,自然画像分類に利用される大規模モデルを採用し,事前学習の利点を生かした。
論文参考訳(メタデータ) (Wed, 24 May 2023 06:15:27 GMT)
Defining a quantum active particle using non-Hermitian quantum walk [0.0] 非エルミート量子ウォークを用いた量子アクティブ・マッターモデルを提案する。
1次元と2次元のシステムで数値結果を示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:36:17 GMT)
Deep state-space modeling for explainable representation, analysis, and
generation of professional human poses [0.0] 本稿では,人間の動作を説明可能な表現にするための3つの新しい手法を紹介する。
トレーニングされたモデルは、専門家のフルボディのデキスタリティ分析に使用される。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:39:48 GMT)
Deep recurrent networks predicting the gap evolution in adiabatic
quantum computing [0.0] ハミルトン問題を完全に同定するパラメータからギャップのパラメトリック依存への写像を発見するためのディープラーニングの可能性を探る。
本稿では,パラメータ空間がシステムサイズと線形にスケールする場合に,長期記憶ネットワークがギャップを予測することに成功していることを示す。
注目すべきは、このアーキテクチャがモデルの空間構造を扱うために畳み込みニューラルネットワークと組み合わされると、トレーニング中にニューラルネットワークで見られるものよりも大きなシステムサイズに対してギャップ進化を予測できることである。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:03:06 GMT)
Deep Learning-enabled MCMC for Probabilistic State Estimation in
District Heating Grids [0.0] 地域熱グリッドは、将来の低炭素エネルギーシステムにおいて重要な部分である。
ネットワーク熱交換の空間においてマルコフ・チェイン・モンテカルロサンプリングを用いて後部を推定する。
ディープニューラルネットワークは、正確だが遅い非線形ソルバの解を近似するように訓練される。
論文参考訳(メタデータ) (Wed, 24 May 2023 08:47:01 GMT)
Deep Learning-based Bio-Medical Image Segmentation using UNet
Architecture and Transfer Learning [0.0] 我々は,UNetアーキテクチャをスクラッチから実装し,バイオメディカル画像データセットの性能を評価する。
変換学習モデルは、スクラッチから実装されたUNetモデルよりも、画像セグメンテーションにおいて優れた性能を有することを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 07:45:54 GMT)
Deep Learning for Survival Analysis: A Review [0.0] 深層学習(DL)技術の生存分析分野への流入は,方法論的な進歩をもたらした。
現代のDLベースのサバイバルメソッドは、時間と時間のデータ設定において、シナリオの小さなサブセットにのみ対処する。
本稿では、このレビューに含まれるメソッドを、オープンソースでインタラクティブなテーブルとして詳細に評価する。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:56:20 GMT)
Cross-lingual Data Augmentation for Document-grounded Dialog Systems in
Low Resource Languages [0.0] 本稿では,逆トレーニング検索 (Retriever and Re-ranker) と Fid (Fusion-in-decoder) ジェネレータを含む新しいパイプラインCLEM (Cross-Lingual Enhanced Model) を提案する。
また,ハイリソース言語をさらに活用するために,翻訳学習による多言語間のアライメントを実現する革新的なアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:40:52 GMT)
Cross-domain Transfer of defect features in technical domains based on
partial target data [0.0] 多くの技術的ドメインでは、不十分に表現されているのは欠陥やデファクトクラスのみである。
提案手法は,CNNエンコーダをベースとして,そのような条件に対処する。
技術的および非技術的領域でベンチマークされ、合理的な分類結果を示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 19:34:53 GMT)
Creation of NV centers in diamond under 155 MeV electron irradiation [0.0] 負電荷窒素空孔中心(NV-)の濃度が高い単結晶ダイヤモンド基板は固体センサの需要が高い。
本研究では、155MeVの超高エネルギー電子を含む未発見状態における電子照射の効果について検討する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:48:47 GMT)
Control invariant set enhanced safe reinforcement learning: improved
sampling efficiency, guaranteed stability and robustness [0.0] この研究は、制御不変集合(CIS)拡張RLと呼ばれる新しいRLトレーニング手法を提案する。
提案手法のロバスト性は不確実性の存在下で検討される。
その結果,オフライントレーニングにおけるサンプリング効率の大幅な向上と,オンライン実装におけるクローズドループ安定性の保証が得られた。
論文参考訳(メタデータ) (Wed, 24 May 2023 22:22:19 GMT)
Computer Vision for Construction Progress Monitoring: A Real-Time Object
Detection Approach [0.0] 建設進捗監視(CPM)は、効率的なプロジェクト管理、オンタイムおよび予算の納入を保証するために不可欠である。
従来のCPMメソッドは、しばしば手動による検査と報告に頼っている。
本稿では,最先端オブジェクト検出アルゴリズムを用いたCPMの自動検出手法を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:27:42 GMT)
Community as a Vague Operator: Epistemological Questions for a Critical
Heuristics of Community Detection Algorithms [0.0] 我々は「コミュニティ」と呼ばれるノードとエッジのパターンとしてのネットワーク科学の数字の性質と結果を分析することを目的としている。
2002年にミシェル・ギルバン(英語版)とマーク・ニューマン(英語版)(英語版)が広めた「コミュニティ」の創始について、異なる系統を網羅的に理解することができる。
我々は,「コミュニティ」が,ソーシャルネットワーキングサイトにおけるエコーチャンバーの生成などの社会的関係を再構築する力で,真の抽象化として機能できると主張している。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:19:39 GMT)
Client Selection for Federated Policy Optimization with Environment
Heterogeneity [0.0] 政策反復(PI)は、強化学習(RL)の多くのアルゴリズムに影響を与えた。
本稿では,Approximate PI (API) のフェデレーションバージョンについて検討し,そのエラー境界を導出する。
追加の近似誤差を軽減するために,クライアント選択アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:13:37 GMT)
Classical-quantum correspondence for particles in the Penning trap [0.0] 我々は、ペニングトラップ内の粒子の運動を記述するシュリンガー方程式の新しい解を導出した。
これらの解は古典軌道の直和である。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:29:30 GMT)
Challenges of ELA-guided Function Evolution using Genetic Programming [0.0] 探索ランドスケープ解析(ELA)特性によって導かれる遺伝的プログラミング手法は,必ずしも満足度の高い関数を見つけることができないことを示す。
以上の結果から, 景観特性の重み付けに対する注意深い考察が, 対象の景観に十分適応する関数の進化に必要である可能性が示唆された。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:31:01 GMT)
Can Large Language Models emulate an inductive Thematic Analysis of
semi-structured interviews? An exploration and provocation on the limits of
the approach and the model [0.0] 本稿では, GPT 3.5-Turboモデルを用いて, 帰納的テーマ解析のいくつかの側面をエミュレートした実験結果と考察を行った。
本論文の目的は, 定性解析における人間アナリストの代替ではなく, LLMデータ操作のいくつかの要素がある程度の定性研究を支援することができるかを知ることである。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:01:51 GMT)
Calc-X: Enriching Arithmetical Chain-of-Thoughts Datasets by Interaction
with Symbolic Systems [0.0] 本稿では,半構造化鎖を扱うための,機械処理可能なHTMLライクなフォーマットを提案する。
データセットをこの統一形式に変換することで、大きな言語モデルと記号システムの効果的な統合を可能にします。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:58:20 GMT)
Blackbody thermodynamics in the presence of Casimir's effect [0.0] 本論文は, 壁が完全な導体でできている薄板内における温度T$の電磁放射の研究である。
熱力学的パラメータとして$T$、$A$、$d$を、ブラウンとマクレーによって計算されたストレス-運動量テンソルのアンサンブル平均のスラブ上での積分を含む手順から、自由エネルギーを得る。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:11:45 GMT)
Beyond Individual Input for Deep Anomaly Detection on Tabular Data [0.0] 異常検出は、金融、医療、サイバーセキュリティなど、さまざまな分野において重要である。
本稿では,非パラメトリックトランスフォーマー(NPT)を利用した新しい深層異常検出手法を提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:13:26 GMT)
Behavior quantification as the missing link between fields: Tools for
digital psychiatry and their role in the future of neurobiology [0.0] 現在の技術は、行動特性を改善するためのエキサイティングな機会です。
携帯電話のGPSやスマートウォッチの加速度計などの受動的センサーストリームを連続的に収集する新機能は、新しい疑問の道を開く。
理論上、現在の技術で捉えられるものには大きな可能性があるが、それ自体は大きな計算課題である。
論文参考訳(メタデータ) (Wed, 24 May 2023 17:45:10 GMT)
Bandit-Based Policy Invariant Explicit Shaping for Incorporating
External Advice in Reinforcement Learning [0.0] 強化学習(RL)エージェントの重要な課題は、外部/専門家1のアドバイスを学習に取り入れることである。
本稿では,RLの外部アドバイスを整形バンドイット(shaping-bandit)と呼ばれるマルチアームバンドイットとして組み込むことの問題点を定式化する。
提案手法は,提案手法の非定常特性を考慮しない既存の帯域幅と整形アルゴリズムを直接適用することにより,結果の低下につながることを示す。
論文参考訳(メタデータ) (Wed, 24 May 2023 18:04:42 GMT)
Automated Refugee Case Analysis: An NLP Pipeline for Supporting Legal
Practitioners [0.0] 本稿では,訴訟から対象情報を検索,処理,抽出するためのエンドツーエンドパイプラインを提案する。
カナダにおける難民法を事例として,未研究の法域を調査した。
論文参考訳(メタデータ) (Wed, 24 May 2023 19:37:23 GMT)
Attention to Mean-Fields for Particle Cloud Generation [0.0] 機械学習を用いたコライダーデータの生成は、粒子物理学における顕著な研究トピックとして浮上している。
粒子間の複雑な相関を正確にモデル化することは かなり困難です
本稿では,これらの課題に対処するためのアテンションベースのアグリゲーション機構を利用した新しいモデルを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 15:38:43 GMT)
Asymptotics of quantum channels [0.0] 量子チャネルに付随する二項時間半群の力学に関するいくつかの側面について論じる。
チャーター多様体上の量子チャネルの作用を記述する写像の明示的な表現を用いることで、力学における置換の役割を解明する。
論文参考訳(メタデータ) (Wed, 24 May 2023 14:01:15 GMT)
Applications of Machine Learning in Detecting Afghan Fake Banknotes [0.0] アフガニスタンにおける偽通貨の流行は大きな課題を引き起こし、経済に有害な影響を及ぼす。
本稿では,特定のセキュリティ特徴を解析して偽のアフガン紙幣を識別する画像処理手法を提案する。
ランダムフォレストアルゴリズムは偽のアフガン紙幣を99%の精度で検出した。
論文参考訳(メタデータ) (Wed, 24 May 2023 05:39:46 GMT)
Analysis of modular CMA-ES on strict box-constrained problems in the
SBOX-COST benchmarking suite [0.0] ボックス制約は決定変数の領域を制限し、現実世界の最適化問題に共通する。
COCO/BBOBのような既存のベンチマークスイートは、実現不可能なソリューションの評価を可能にする。
本稿では,厳密なボックス制約付きベンチマークスイート(SBOX-COST)の初期研究について述べる。
予想とは裏腹に、飽和によるボックス制約の扱いは、それを処理しないよりも必ずしも良いものではない、ということが分かっています。
論文参考訳(メタデータ) (Wed, 24 May 2023 12:37:03 GMT)
An optical-lattice with ultra-narrow trapping teeth featuring phononic
bus in multi-dimensional geometry [0.0] 本稿では,サブ波長空間構造を持つ原子光学格子の新しい手法を提案する。
このポテンシャルは、3レベルリドベルク配位原子の非線形光学応答によって形成される。
格子は、ナノメートル以下の幅を持つ超狭いローレンツ井戸の3次元配列で構成されている。
論文参考訳(メタデータ) (Wed, 24 May 2023 11:45:12 GMT)
Algodoo for Online Education: Impulse and Momentum Activities [0.0] Algodooプログラムは、オンライン授業に学生が積極的に参加することを保証することで、教育環境の効率を高めることができる。
合計で6種類の応用が実施され,1つはインパルスの主題,1は運動量,2はインパルスと運動量の変化の関係,そして2つは運動量保存に関するものであった。
論文参考訳(メタデータ) (Wed, 24 May 2023 13:10:59 GMT)
A feature selection method based on Shapley values robust to concept
shift in regression [0.0] データセットシフトの問題に遭遇することが一般的であり、具体的には変数間の関係の変化(概念シフト)である。
この場合、変換フェーズで学習した関係が現在の状況と一致しないため、変数の影響はモデルの回帰子としての品質を示す唯一の指標にはならない。
本稿では,この事実を考慮に入れた回帰問題に対する特徴選択手法を提案し,各変数が予測に与える影響をShapley値を用いて検討する。
論文参考訳(メタデータ) (Wed, 24 May 2023 16:43:42 GMT)
A Toy Model of Universality: Reverse Engineering How Networks Learn
Group Operations [0.0] 我々は,小人数のニューラルネットワークが集団構成の実装をどのように学習するかを検討することによって,普遍性仮説を検証した。
本稿では,ニューラルネットワークが任意の有限群の合成を数学的表現理論によって実装できる新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 22:13:13 GMT)
A Performance Study of Variational Quantum Algorithms for Solving the
Poisson Equation on a Quantum Computer [0.0] 偏微分方程式 (Partial differential equation, PDE) は、物質や流れのシミュレーションで用いられる。
短期から短期までの量子プロセッサの有用な展開への最も有望なルートは、いわゆるハイブリッド変分量子アルゴリズム(VQA)である。
我々は、PDEの最も単純なプロトタイプであるポアソン方程式を解くために、実量子デバイス上でのVQAの利用に関する広範な研究を行う。
論文参考訳(メタデータ) (Wed, 24 May 2023 09:07:17 GMT)
A Human-in-the-Loop Approach for Information Extraction from Privacy
Policies under Data Scarcity [0.0] プライバシポリシアノテーションに対するHuman-in-the-Loopアプローチのプロトタイプシステムを提案する。
本稿では,プライバシポリシアノテーションの領域で一般的なデータ不足の制約に特化して,MLに基づく提案システムを提案する。
論文参考訳(メタデータ) (Wed, 24 May 2023 10:45:26 GMT)