A Review of Deep Learning for Video Captioning [111.2] ビデオキャプション(VC)は、素早く動き、学際的な研究分野である。
この調査では、注目に基づくアーキテクチャ、グラフネットワーク、強化学習、敵対的ネットワーク、高密度ビデオキャプション(DVC)など、ディープラーニングベースのVCをカバーする。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 15:30:54 GMT)
Mesh Convolution with Continuous Filters for 3D Surface Parsing [101.3] 本稿では、3次元トライアングルメッシュから効果的な幾何学的特徴学習のための一連のモジュラー演算を提案する。
メッシュ畳み込みは球面調和を正規直交基底として利用し、連続畳み込みフィルタを生成する。
さらに,PicassoNet++という3次元表面の知覚解析のための新しい階層型ニューラルネットワークを提案する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 02:14:33 GMT)
NaviNeRF: NeRF-based 3D Representation Disentanglement by Latent
Semantic Navigation [62.0] 3D表現のゆがみは、3Dデータの基本的な説明因子を特定し、分解し、操作することを目的としている。
NeRFは生成するNeRFパイプライン上に構築されており、アウターナビゲーションブランチとインナーリファインメントブランチを備えている。
NaviNeRFは、従来の3D対応モデルよりもきめ細かい3Dディスタングル能力が優れている。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 07:48:17 GMT)
Quantum walk processes in quantum devices [55.4] グラフ上の量子ウォークを量子回路として表現する方法を研究する。
提案手法は,量子ウォークアルゴリズムを量子コンピュータ上で効率的に実装する方法である。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 10:14:46 GMT)
CCLAP: Controllable Chinese Landscape Painting Generation via Latent
Diffusion Model [54.7] 制御可能な中国の風景画作成方法CCLAP。
本手法は,特に芸術的・芸術的概念において,最先端の演奏を実現する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 13:58:49 GMT)
LLM+P: Empowering Large Language Models with Optimal Planning
Proficiency [52.1] 大規模言語モデル(LLM)は、目覚ましいゼロショットの一般化能力を示している。
古典的なプランナーは、一度形式化された方法で問題が与えられると、効率的な検索アルゴリズムを使って、正しい、あるいは最適なプランを素早く特定できる。
本稿では,従来のプランナーの強みを LLM に組み込んだ最初のフレームワークである LLM+P を紹介する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 20:34:03 GMT)
Modelling Latent Dynamics of StyleGAN using Neural ODEs [52.0] 我々は、GANから独立に反転した潜在符号の軌跡を学習する。
学習した連続軌道により、無限のフレームと一貫したビデオ操作を行うことができる。
提案手法は最先端の性能を実現するが,計算量が少なくなる。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 20:18:14 GMT)
Vision Transformers, a new approach for high-resolution and large-scale
mapping of canopy heights [50.5] 分類(離散化)と連続損失関数を最適化した新しい視覚変換器(ViT)モデルを提案する。
このモデルは、従来使用されていた畳み込みベースのアプローチ(ConvNet)よりも、連続損失関数のみで最適化された精度が向上する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 22:39:03 GMT)
Know Your Space: Inlier and Outlier Construction for Calibrating Medical
OOD Detectors [39.8] 我々は、よく校正されたアウト・オブ・ディストリビューション検出器(OOD)の開発に焦点をあてる。
適切なキャリブレーションデータセットのキュレーションが困難であるために、合成オーグメンテーションは不整合/不整合仕様において非常に普及している。
最適プロトコルは,様々な画素空間外値とともに潜在空間不整形を合成することである。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 15:31:55 GMT)
Unsupervised Story Discovery from Continuous News Streams via Scalable
Thematic Embedding [37.6] 関連ニュース記事のあるストーリーをリアルタイムで発見することは、高価な人間のアノテーションなしで巨大なニュースストリームを消化するのに役立ちます。
記事や物語を動的に表現するために,既訓練の文エンコーダを用いた新しいテーマ埋め込みを提案する。
実ニュースデータセットによる徹底的な評価は、USTORYがベースラインよりも高いストーリー発見性能を達成することを示す。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 15:48:07 GMT)
An Investigation of Face Mask Use with Busking Videos on YouTube during
COVID-19: a Case Study in South Korea [37.6] マスクを着用することは、新型コロナウイルスの感染リスクを減らし、感染を抑える効果的な手段である。
現在の世界的な調査はほとんどが自己申告によるものであり、その保証は困難である。
本研究は,公衆のビッグデータを利用して,マスク使用の正確な世界的調査を行う上で,重要な可能性を示すものである。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 05:30:27 GMT)
Detecting Adversarial Faces Using Only Real Face Self-Perturbations [34.8] アドリアックは、入力サンプルに特定のノイズを加えることで、ターゲットシステムの機能を妨害することを目的としている。
既存の防御技術は、特定の対向顔(adv-faces)の検出において高い精度を達成する
全く異なるノイズパターンを持つ新しい攻撃方法、特にGANベースの攻撃は、それらを回避し、より高い攻撃成功率に達する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 09:55:48 GMT)
Input Augmentation with SAM: Boosting Medical Image Segmentation with
Segmentation Foundation Model [34.3] Segment Anything Model (SAM) はコンピュータビジョンタスクのための汎用セグメンテーションのための大規模モデルである。
SAMは100万枚の画像と10億枚以上のマスクを使って訓練され、自然の風景画像に広範囲のオブジェクトのセグメンテーション結果を生成することができる。
本報告では,SAMは医用画像の高品質なセグメンテーションを提供していないが,その生成マスク,特徴,安定性スコアは,より優れた医用画像セグメンテーションモデルの構築と訓練に有用であることを示す。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 07:11:53 GMT)
Towards Understanding Feature Learning in Out-of-Distribution
Generalization [31.1] 我々は、既に学習済みの機能を保持し、複数のラウンドで新しい機能を増強することによって、すべての有用な機能を学ぶためにモデルを強制する機能強化トレーニングを提案する。
実験により、FATはよりリッチな特徴を効果的に学習し、様々な目的に適用した場合のOOD性能を一貫して改善することが示された。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 05:57:00 GMT)
MAWSEO: Adversarial Wiki Search Poisoning for Illicit Online Promotion [30.6] 本稿では,Wiki上のステルスブラックハットSEOが自動化可能であることを示す研究を報告する。
我々の技術はMAWSEOと呼ばれ、現実のサイバー犯罪の目的を達成するために敵のリビジョンを用いています。
評価とユーザスタディにより,MAWSEOは敵の破壊的編集を効果的かつ効率的に生成できることが示された。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 03:13:05 GMT)
Single-stage Multi-human Parsing via Point Sets and Center-based Offsets [28.7] 本稿では,マルチヒューマン解析問題を2つの微粒なサブプロブレムに分解する,高性能なシングルステージマルチヒューマンパーシングアーキテクチャを提案する。
提案手法では,より少ない訓練エポックとより複雑なモデルアーキテクチャを必要とする。
特に、提案手法では、トレーニングのエポックを少なくし、より複雑なモデルアーキテクチャを必要とする。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 09:30:50 GMT)
Fast Diffusion Probabilistic Model Sampling through the lens of Backward
Error Analysis [26.9] 拡散確率モデル (DDPM) は強力な生成モデルの一種である。
DDPMは通常、サンプルを生成するために数百から数千の連続関数評価(ステップ)を必要とする。
本稿では,高い試料品質を維持しつつ,ステップの少ないDDPMの高速サンプリング法を開発することを目的とする。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 16:58:47 GMT)
Understanding EFL Student Idea Generation Strategies for Creative
Writing with NLG Tools [25.5] 自然言語生成(英: Natural Language generation、NLG)は、人工知能において、コンピュータシステムが情報から人間の理解可能な言語テキストを生成する過程である。
本研究では、NLGツールを用いたアイデア検索において、英語を外国語(EFL)の学生として採用する戦略について検討する。
学生は、NLGツールが生成したアイデアに対するいくつかの嫌悪感を示し、さらに多くのアイデアを生み出したNLGツールを選択した。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 10:03:48 GMT)
Towards Carbon-Neutral Edge Computing: Greening Edge AI by Harnessing
Spot and Future Carbon Markets [24.5] 我々は、CERを複数の時間スケールで購入し、機械学習タスクをオフロードする場所を決定するオンラインアルゴリズムを提案する。
さらに,$T$-slot問題のNP硬度を考慮し,資源制限付きランダム化依存ラウンドリングアルゴリズムを提案する。
実炭素強度トレースによって駆動される理論解析と広範囲なシミュレーション結果は,提案アルゴリズムの優れた性能を示す。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 11:14:16 GMT)
LaMP: When Large Language Models Meet Personalization [23.9] 本稿では、自然言語理解・生成の現状におけるパーソナライズの重要性を強調する。
パーソナライズされたアウトプットを生成するための言語モデルのトレーニングと評価のための新しいベンチマークであるLaMPベンチマークを紹介します。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 13:42:04 GMT)
Detecting Spoilers in Movie Reviews with External Movie Knowledge and
User Networks [23.6] オンライン映画レビュープラットフォームは、映画産業と一般大衆にクラウドソースによるフィードバックを提供している。
自動でスポイラーを識別するための予備的な研究が実施されたが、それらは単にレビューの内容そのものに焦点を当てているだけであった。
本稿では,映画レビュープラットフォーム上での映画やユーザ活動の外部知識を考慮した,新しい多視点スポイラー検出フレームワークであるMVSDを提案する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 13:54:31 GMT)
On Accelerating Diffusion-Based Sampling Process via Improved
Integration Approximation [23.4] 1つの一般的な拡散に基づくサンプリング戦略は、逆常微分方程式(ODE)を効果的に解こうとするものである。
改良された積分近似(IIA)を用いて特定の係数を最適化することにより、人気のあるODEベースのサンプリングプロセスの高速化を検討する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 06:06:28 GMT)
Lookahead Diffusion Probabilistic Models for Refining Mean Estimation [23.4] 本研究では,拡散確率モデル(DPM)における後続の時間ステップよりも深部ニューラルネットワーク(DNN)の出力の相関性を利用するLA-DPMを提案する。
典型的なDPMは、最新の$boldsymbolz_i$とindex $i$をDNNモデルに入力することで、最初に元のデータサンプル$boldsymbolx$の推定値を取得する。
我々は$boldsymbolx$の2つの推定値に対して$boldsymbolx$を供給して得られる外挿を行うことにより、より正確な$boldsymbolx$の推定値を計算することを提案する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 03:58:08 GMT)
Medium. Permeation: SARS-COV-2 Painting Creation by Generative Model [22.8] このアートワークは、14〜14マトリックスに配置されたランダムに生成された196枚のバイラル絵からなり、大規模な絵画を形成する。
LEDテレビ画面の前には、色が連続的に変化する196枚のウイルス絵が現れる。
これはまた、印象派と新型コロナウイルスの共通点と比喩的な共生に基づく世界で初めての生成芸術でもある。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 09:27:47 GMT)
A Modulation Layer to Increase Neural Network Robustness Against Data
Quality Issues [22.6] データ不足と品質は機械学習における一般的な問題であり、特に医療などの高度なアプリケーションにおいて問題となる。
本稿では、低品質データと欠落データの影響を軽減するために、ニューラルネットワークの新たな修正を提案する。
この結果から, 情報品質の低減を全接続層で明示的に考慮することにより, リアルタイムアプリケーションへの人工知能システムの展開が可能であることが示唆された。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 19:48:08 GMT)
Fast MRI Reconstruction via Edge Attention [22.3] 本稿では,エッジ誘導によるMRI画像再構成のための,軽量かつ高精度なエッジ注意MRI再構成ネットワークを提案する。
我々は、ぼやけた画像から正確なエッジを直接予測する効率的なエッジ予測ネットワークを設計する。
また,抽出したエッジ先行情報を利用した画像再構成のための新しいエッジアテンションモジュール(EAM)を提案する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 13:19:33 GMT)
LiDAR2Map: In Defense of LiDAR-Based Semantic Map Construction Using
Online Camera Distillation [21.5] 鳥眼ビュー(BEV)の下でのセマンティックマップの構築は、自律運転において重要な役割を担っている。
本稿では,LiDARを用いたセマンティックマップ構築手法を提案する。
セマンティックマップ構築のための堅牢なマルチスケールBEV特徴を学習するBEVピラミッド特徴デコーダを導入する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 12:05:29 GMT)
The Devil is in the Upsampling: Architectural Decisions Made Simpler for
Denoising with Deep Image Prior [20.3] Deep Image Prior (DIP)は、いくつかのネットワークアーキテクチャが自然に滑らかな画像に偏り、ノイズに抵抗することを示している。
DIPは大規模なトレーニングセットの要件を取り除いているが、アーキテクチャ設計とノイズ適合という2つの現実的な課題を提示している。
本研究では,DIPにおけるデノナイジング現象の主要因はアンリートアップサンプリングであることを示すため,周波数観点から解析を行った。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 13:50:27 GMT)
Nonverbal Cues in Human-Robot Interaction: A Communication Studies
Perspective [19.7] 人とのコミュニケーションは、多種多様な非言語的手がかりによって特徴づけられる。
我々は人間-ロボットインタラクション(HRI)のための決定的な非言語コードを提供する。
我々は、ロボット非言語コードをHRIに統合することで、ロボットに「アライブネス」や「社会的エージェンシー」を感じることができると主張している。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 02:15:48 GMT)
Kinship Representation Learning with Face Componential Relation [18.4] Kinship Recognitionは、2つの顔画像の被験者が近親者か非近親者かを判定することを目的としている。
従来手法では,顔画像間の空間的相関を考慮せずに設計に重点を置いていた。
画像間の顔成分の関係を学習する顔成分関係ネットワーク(FaCoRNet)を提案する。
FaCoRNetは、最大の公的な親族認識FIWベンチマークにおいて、最先端の手法よりも大きなマージンで優れている。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 09:10:57 GMT)
Understanding Lexical Biases when Identifying Gang-related Social Media
Communications [18.3] シカゴのギャング関連ツイートを識別するために、バイナリロジスティック分類器を使用します。
ツイートの言語は非常に関連性が高く、ビッグデータのメソッドや機械学習モデルを使用することで、言語がモデルのパフォーマンスに与える影響をよりよく理解する必要があります。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 21:51:49 GMT)
Language Models are Realistic Tabular Data Generators [15.9] 本稿では,GReaT (Generation of Realistic Tabular data) を提案する。
提案手法の有効性を,複数角度から得られたデータサンプルの有効性と品質を定量化する一連の実験で実証した。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 10:03:23 GMT)
OmniLabel: A Challenging Benchmark for Language-Based Object Detection [15.7] 本稿では,言語に基づくオブジェクト検出のための新しいタスク定義,データセット,評価指標を提案する。
25K以上のイメージに28K以上のユニークなオブジェクト記述があるため、OmniLabelは挑戦的なベンチマークを提供する。
提案した評価は,大口径ラベル空間を処理し,修正された平均精度測定値を用いて性能を判定する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 18:35:50 GMT)
Unsupervised CD in satellite image time series by contrastive learning
and feature tracking [15.1] 特徴追跡を用いたコントラスト学習を用いた衛星画像時系列における教師なし変化検出のための2段階のアプローチを提案する。
事前学習したモデルから擬似ラベルを抽出し,特徴追跡を用いて画像時系列間で伝達することにより,擬似ラベルの一貫性を改善し,長期リモートセンシング画像時系列における季節変化の課題に対処する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 11:19:19 GMT)
Reinforcement Learning with an Abrupt Model Change [15.1] 強化学習の問題は、環境やモデルが変化するところにあると考えられる。
エージェントがこのような問題に適応して最適な長期割引報酬を実現するアルゴリズムが提案されている。
アルゴリズムはモデルフリーであり、環境と相互作用することで最適なポリシーを学習する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 18:16:01 GMT)
SSN: Stockwell Scattering Network for SAR Image Change Detection [15.0] 提案したSSNは、ノイズ耐性の特徴表現を提供し、SAR画像変化検出における最先端性能を得る。
3つの実SAR画像データセットの実験結果から,提案手法の有効性が示された。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 13:35:34 GMT)
Interacting with Masculinities: A Scoping Review [13.3] 我々は、人間性のジェンダーフルな性質を認識し、男性や男性らしさの回避を認め、女性やジェンダーフルな民族を中心的な俳優や変化の標的として負担するのを避ける必要がある。
本稿では,ACM Human Factors in Computing Systems 会議に提出された126件の論文のスクーピングレビューを通じて,HCIにおける男性学の30年の歴史について紹介する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 08:51:41 GMT)
"I'm" Lost in Translation: Pronoun Missteps in Crowdsourced Data Sets [13.3] クラウドソーシングのイニシアチブは、自然言語処理(NLP)に使用される大規模でオープンなデータセットの多言語翻訳に重点を置いている。
本研究は,クラウドソース型タトエバデータベースにおいて,英語と日本語で翻訳された代名詞の事例に着目した。
男性代名詞の偏見は,複数の言語が他の方法で説明されているにもかかわらず,全体として存在することがわかった。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 09:27:32 GMT)
A Policy Gradient Framework for Stochastic Optimal Control Problems with
Global Convergence Guarantee [12.9] 最適制御問題に対するポリシー勾配法を連続的に検討する。
勾配流のグローバル収束を証明し、一定の正則性仮定の下で収束率を確立する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 17:22:47 GMT)
Incomplete Multimodal Learning for Remote Sensing Data Fusion [12.8] 遠隔センシングデータ融合タスクにおけるマルチモーダルトランスフォーマーネットワークの成功には,自己注意操作によるマルチモーダル信号の接続機構が鍵となる。
従来のアプローチでは、トレーニングと推論の両方の間、すべてのモダリティへのアクセスを前提としており、下流アプリケーションでモーダル不完全入力を扱う場合、深刻な劣化を引き起こす可能性がある。
提案手法は,リモートセンシングデータ融合の文脈において,不完全なマルチモーダル学習のための新しいモデルを提案する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 12:16:52 GMT)
Semantic Specialization for Knowledge-based Word Sense Disambiguation [12.6] 知識に基づくWord Sense Disambiguation (WSD) のための有望なアプローチは、ある文中の対象語に対して計算された単語に最も近い文脈的埋め込みを持つ感覚を選択することである。
本稿では,文脈適応型埋め込みを語彙知識のみを用いてWSDタスクに適応させるWSDのセマンティック・スペシャライゼーションを提案する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 07:40:23 GMT)
BiTrackGAN: Cascaded CycleGANs to Constraint Face Aging [12.5] 本稿では,この課題に対処するためのボトムアップトレーニング手法を提案する。
ボトムアップトレーニングにより、2つのCycleGANブロック、すなわち制約機構の間の理想的な中間状態が誘導される。
BiTrackGANは、他のCycleGAN関連法よりも合理的で多様な顔合成を実現する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 04:35:40 GMT)
VisiTherS: Visible-thermal infrared stereo disparity estimation of human
silhouette [11.8] 本稿では,人間のシルエットの差分を推定することに着目し,可視熱赤外立体視のための新しいアプローチを提案する。
高分解能畳み込みニューラルネットワークは、2つのスペクトル間の関係をよりよく捉えるために使用される。
公開データセットの結果は,提案手法の有効性を示す。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 01:53:28 GMT)
3D Human Pose and Shape Estimation via HybrIK-Transformer [11.2] HybrIKは解析的逆運動学とディープラーニングを組み合わせて、より正確な3Dポーズ推定を生成する。
本稿では2Dから3Dへのリフトモジュールの強化を提案し,デコンボリューションをTransformerに置き換える。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 18:11:30 GMT)
Dialectical language model evaluation: An initial appraisal of the
commonsense spatial reasoning abilities of LLMs [10.5] 本稿では,コモンセンス推論のための言語モデルの弁証的評価について検討する。
この種の評価の目標は、集合的なパフォーマンス値を得るのではなく、失敗を見つけ、システムのバウンダリをマップすることにある。
本稿では,空間的推論の特定の場合に対して,このような評価を定性的に検討する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 06:28:46 GMT)
An Unsupervised STDP-based Spiking Neural Network Inspired By
Biologically Plausible Learning Rules and Connections [10.2] スパイク刺激依存性可塑性(STDP)は脳の一般的な学習規則であるが、STDPだけで訓練されたスパイクニューラルネットワーク(SNN)は非効率であり、性能が良くない。
我々は適応的なシナプスフィルタを設計し、SNNの表現能力を高めるために適応的なスパイキングしきい値を導入する。
我々のモデルは、MNISTおよびFashionMNISTデータセットにおける教師なしSTDPベースのSNNの最先端性能を実現する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 05:44:22 GMT)
Trust and Reliance in Consensus-Based Explanations from an
Anti-Misinformation Agent [10.0] 発見は信頼の影響ではなく、コンセンサスに基づく説明への依存の影響を示す。
この研究は、XAIを利用するアンチミス情報システムの設計、特にユーザ中心の説明の設計を導くかもしれない。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 00:06:24 GMT)
Linguistic Dead-Ends and Alphabet Soup: Finding Dark Patterns in
Japanese Apps [10.0] 日本市場で人気のモバイルアプリを200本分析した。
ほとんどのアプリはダークパターンで、1アプリあたり平均3.9であることがわかった。
我々は「翻訳」と「Alphabet Soup」の形式で「言語的デッドエンディング」という新しい暗黒パターンのクラスを特定した。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 08:22:32 GMT)
Can Voice Assistants Sound Cute? Towards a Model of Kawaii Vocalics [10.0] かわいさ・弱さ・魅力を表す「川井」は世界的な文化輸出である。
音声アシスタント音声の音声品質を探索することで、音声が川井になるかどうかを考察する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 01:47:19 GMT)
Transformer-Based LM Surprisal Predicts Human Reading Times Best with
About Two Billion Training Tokens [9.9] 本研究では,トランスフォーマーをベースとした言語モデル変種から,人間の読解時間を予測する能力に基づいて推定した推定値について検討した。
その結果、現代のモデル能力を持つほとんどの変種からの推定は、約20億のトレーニングトークンを見た後、最も適していることがわかった。
新たに訓練されたより小さなモデル変種は収束時に「転換点」を示し、その後言語モデルの難易度が低下し始め、人間の読解時間に適合する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 12:50:49 GMT)
Can ChatGPT Reproduce Human-Generated Labels? A Study of Social
Computing Tasks [9.7] ChatGPTは、ソーシャルコンピューティングタスクにおいて人為的なラベルアノテーションを再現する可能性がある。
姿勢検出(2x),感情分析,ヘイトスピーチ,ボット検出の5つのデータセットを抽出した。
この結果から,ChatGPTはこれらのデータアノテーションタスクを処理できる可能性を秘めていますが,いくつかの課題が残っています。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 08:55:33 GMT)
(Vector) Space is Not the Final Frontier: Product Search as Program
Synthesis [6.1] プログラム合成は、多くのクエリーと市場でかなりの数のプレイヤーに大きな利点をもたらすと我々は主張する。
提案手法の産業的意義を詳述し、実装の詳細をスケッチし、Toyosoで同様のシステムを構築した経験から得られた共通の異議に対処する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 20:00:06 GMT)
A Semi-Supervised Framework for Misinformation Detection [6.0] ソーシャルメディアで誤報が広まることが、社会的な問題となっている。
極度のクラス不均衡に対処する半教師付き学習フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 05:20:58 GMT)
Improving Stain Invariance of CNNs for Segmentation by Fusing Channel
Attention and Domain-Adversarial Training [5.5] 異なるスライド作成技術、化学物質、スキャナ構成などの染色プロトコルのばらつきは、スライド画像全体(WSI)の多様なセットをもたらす可能性がある。
この分布シフトは、見えないサンプルに対するディープラーニングモデルの性能に悪影響を及ぼす可能性がある。
セマンティックセグメンテーションのための単一ソース設定における変化を染色するために,畳み込みニューラルネットワーク(CNN)の一般化性を改善する手法を提案する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 16:54:37 GMT)
Increasing the Scope as You Learn: Adaptive Bayesian Optimization in
Nested Subspaces [5.5] HDBOの最先端手法は、寸法が増加するにつれて性能が低下する。
本稿では,ネストしたランダムな部分空間の新たなファミリを利用したBAxUSを提案する。
包括的な評価により、BAxUSは幅広いアプリケーションに対して最先端の手法よりも優れた結果が得られることが示された。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 19:20:39 GMT)
MS-DCANet: A Novel Segmentation Network For Multi-Modality COVID-19
Medical Images [3.3] コロナウイルス病2019(COVID-19)パンデミックは公衆衛生の負担を増し、人間に深刻な災害をもたらした。
一部の研究者は、モデルの複雑さを追加することによってセグメンテーションの精度を改善した。
本稿では,MS-DCANetという対称デコーダセグメンテーションフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 09:25:32 GMT)
Rationally Extended Harmonic Oscillator potential, Isospectral Family
and the Uncertainity Relations [2.6] 従来と同一視される有理拡張調和ポテンシャルについて考察する。
異なる$m$と$lambda$に対する等スペクトル族ポテンシャル全体の不確実性関係も計算される。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 04:44:28 GMT)
Boosting Theory-of-Mind Performance in Large Language Models via
Prompting [2.5] 本研究は,GPT-4および3種類のGPT-3.5のToM特性を測定する。
ToM理解の改善における文脈内学習の有効性を検討した。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 22:50:50 GMT)
EEE, Remediating the failure of machine learning models via a
network-based optimization patch [2.4] ネットワークベースの最適化手法であるEEEは、検証可能な状態推定を提供する目的で提案されている。
EEEは、効率と収束の点で、競争力があるか、一般的な最適化手法よりも優れていることが示されている。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 05:23:46 GMT)
ML-based Approaches for Wireless NLOS Localization: Input
Representations and Uncertainty Estimation [2.3] 非線形(NLOS)ローカライゼーションは多くの無線ネットワークアプリケーションにおいて重要である。
本稿では, 単一無線無線経路特徴, (ii) 無線無線リンク特徴 (multi-path) および (iii) 画像ベース表現の3つの異なる入力表現について検討する。
後者の2つの新しい表現に触発されて、2つの畳み込みニューラルネットワーク(CNN)を設計し、NLOSのローカライゼーション性能を著しく改善していないが、よりリッチな予測出力をサポートすることができることを示した。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 13:13:07 GMT)
Experimental demonstration of the criterion for the prepare-and-measure
nonclassicality [2.0] 準備と測定理論は、物理系の次元性の観点から古典理論と量子力学の非互換性を明らかにする新しいタイプの量子パラドックスである。
与えられたユアンタ状態が準備と測定の非古典性を示すことができるかどうかを判断するために、準備と測定の理論には同様の基準が必要である。
本研究では,52種類の異なる量子状態が1つずつ準備され,それぞれが準備と測定の非古典性を示すことができるかどうかを判定するために,この基準を実験的に検証する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 06:18:54 GMT)
Implicit Bias of Gradient Descent for Mean Squared Error Regression with
Two-Layer Wide Neural Networks [1.4] 幅$n$浅いReLUネットワークをトレーニングする解は、トレーニングデータに適合する関数の$n-1/2$以内であることを示す。
また, トレーニング軌道はスムーズなスプラインの軌道によって捕捉され, 正規化強度は低下することを示した。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 14:35:36 GMT)
L3Cube-IndicSBERT: A simple approach for learning cross-lingual sentence
representations using multilingual BERT [0.8] SBERT (Multilingual Sentence-BERT) モデルは、異なる言語を共通表現空間にマッピングする。
合成コーパスを用いたバニラ多言語BERTモデルから多言語文BERTモデルへ変換する手法を提案する。
多言語BERTモデルは本質的に言語間学習者であり、この単純なベースライン微調整アプローチは、例外的な言語間特性をもたらす。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 15:45:40 GMT)
Dilated-UNet: A Fast and Accurate Medical Image Segmentation Approach
using a Dilated Transformer and U-Net Architecture [0.6] 本稿では,Dilated-UNetについて紹介する。Dilated-UNetはDilated TransformerブロックとU-Netアーキテクチャを組み合わせることで,高精度かつ高速な医用画像セグメンテーションを実現する。
実験の結果,Dilated-UNetはいくつかの挑戦的な医用画像セグメンテーションデータセットにおいて,他のモデルよりも優れていた。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 17:20:13 GMT)
SimplyMime: A Control at Our Fingertips [0.2] 本稿では,消費者電子製品の複数リモコンの必要性を解消することを目的とした,SimplyMimeという新しいシステムを提案する。
SimplyMimeは動的手ジェスチャー認識アーキテクチャを活用し、人工知能とヒューマン・コンピュータ・インタラクションを取り入れている。
動きの流れ中のジェスチャーを検知・認識する手法の性能を徹底的に検証し,検証した。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 11:25:19 GMT)
Romanian Multiword Expression Detection Using Multilingual Adversarial
Training and Lateral Inhibition [0.2] 本稿では、PARSEME v1.2共有タスク用にリリースされたコーパス上でのルーマニア語マルチワード式の自動識別の改善について述べる。
提案手法では,最近導入された側方抑制層に基づく多言語的視点と,多言語言語モデルの性能向上のための対角訓練を仮定する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 09:10:49 GMT)
Identifying Appropriate Intellectual Property Protection Mechanisms for
Machine Learning Models: A Systematization of Watermarking, Fingerprinting,
Model Access, and Attacks [0.1] 機械学習(ML)の商業的利用は拡大しており、同時に、MLモデルはより複雑になり、トレーニングコストも高まっている。
本稿では,MLにおけるIPPに関する知見を体系化するとともに,文書作成時に提案される脅威や攻撃,防衛に焦点をあてる。
我々はMLにおけるIPの包括的脅威モデルを構築し、統合された分類体系の中で攻撃と防御を分類する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 01:05:48 GMT)
Two Birds, One Stone: A Unified Framework for Joint Learning of Image
and Video Style Transfers [0.0] 現在の任意のスタイル転送モデルは、画像ドメインまたはビデオドメインに限られている。
画像とビデオの両方のための統一スタイル転送フレームワークUniSTを紹介する。
両タスクの最先端アプローチに対して,UniSTが好適に動作することを示す。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 07:15:49 GMT)
Theory of high-energy correlated multiphoton x-ray diffraction for
synchrotron radiation sources [0.0] 非相対論的極限における多光子回折現象の理論的定式化について述べる。
近似の階層と制限ケースの体系的解析を示す。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 16:26:28 GMT)
Stimulating student engagement with an AI board game tournament [0.0] 本稿では,2年生にボードゲームに適用した検索手法の紹介を行うプロジェクトベース・コンペティションベースの学士課程について紹介する。
2人のグループがネットワークプログラミングとAIメソッドを使用して、今年のボードゲームトーナメントに出場するためにAIエージェントを構築する必要があります。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 11:22:00 GMT)
Statistical analysis of chess games: space control and tipping points [0.0] まず,空間特性と駒の位置に着目し,ゲーム中の移動回数が結果と正の相関関係にあることを示す。
次に、部品のヒートマップを研究し、その空間分布が、エンジン(例えば、ストックフィッシュ)よりも人間のプレイヤー間では変化しないことを示す。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 14:54:34 GMT)
On the Identification of the Energy related Issues from the App Reviews [0.0] アプリのエネルギ非効率性は、App Storeで広く議論されているアプリユーザーにとって大きな問題となる可能性がある。
これまでの研究では、エネルギー関連アプリのレビューを調査して、エネルギー関連ユーザのフィードバックの主要な原因やカテゴリを特定することが重要であった。
本研究では,エネルギー関連ユーザのフィードバックを自動的に抽出する様々な手法を実証的に研究する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 01:54:30 GMT)
Observing and braiding topological Majorana modes on programmable
quantum simulators [0.0] トポロジカルマヨナモードとして知られる集合励起は摂動に対して自然に安定である。
この研究は、クラウドラン量子シミュレーションにおいて、長時間の量子現象が誰でも実現可能であることを示している。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 03:48:40 GMT)
Non-adiabatic coupling as friction in the formation of H3+: A classical
mechanical study [0.0] 古典的な運動方程式は、H3+のテストケースに対して解かれる。
その結果, (D+, H2) 衝突の速度は十分に遅くなり, 安定なDH2+が形成されることがわかった。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 14:46:57 GMT)
N2G: A Scalable Approach for Quantifying Interpretable Neuron
Representations in Large Language Models [0.0] N2Gは、ニューロンとそのデータセットの例を取り、これらの例のニューロンの振る舞いを解釈可能なグラフに自動的に蒸留するツールである。
我々は、重要なトークンのみを提示するためにトランケーションとサリエンシ法を使用し、より多様なサンプルでデータセットの例を拡大し、ニューロンの振る舞いの程度をより正確に把握する。
これらのグラフは、研究者による手動による解釈を助けるために視覚化できるが、テキスト上でトークンアクティベーションを出力して、ニューロンの基底真理アクティベーションと比較して自動検証することも可能だ。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 19:06:13 GMT)
Hyper-Laplacian Regularized Concept Factorization in Low-rank Tensor
Space for Multi-view Clustering [0.0] マルチビュークラスタリングのための低ランクテンソル空間における超ラプラシア正規化概念分解(HLRCF)を提案する。
具体的には、各ビューの潜在クラスタ単位の表現を探索するために、概念因子化を採用します。
異なるテンソル特異値が構造情報と不等値とを関連付けることを考慮し、自己重み付きテンソルSchatten p-ノルムを開発する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 15:46:58 GMT)
Hidden Quantum Memory: Is Memory There When Somebody Looks? [0.0] 古典物理学では、メモリレス力学とマルコフ統計は同一である。
これは量子力学には当てはまりません。
我々は、その生成にメモリを根本的に要求する量子過程を探索することによって収集されたマルコフ統計の存在を確立する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 02:56:56 GMT)
Generation of a squeezed coherent state defined with the Lie-Trotter
product formula using a nonlinear photonic crystal [0.0] 非線形フォトニック結晶を用いた圧縮コヒーレント光の生成法について検討した。
圧縮コヒーレント状態はリー・トロッター積公式で定義される。
この圧縮されたコヒーレント状態が15.9ドルdBで現実的に得られることを示す。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 11:01:59 GMT)
Fresh study of simultaneous electron-photon excitation of a Hydrogen
atom based on Bethe-Born approximation [0.0] 電子の最初の運動量に対してレーザー場が垂直または平行なジオメトリの励起断面積を評価する。
本研究は、Bethe-Born近似が同時電子光子励起過程の励起断面積に対して妥当な結果をもたらすことを示唆している。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 03:20:41 GMT)
Electron quantum optics with beam splitters and waveguides in Dirac
Matter [0.0] 電子波動関数の分割はディラック型物理学を支えるシステムのために検討されている。
電子ビームスプリッターとスーパーフォーカスはナノリボンの伝播とともに分析される。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 12:54:56 GMT)
Closing the Door on the Puzzle of Decoherence of Annihilation Quanta [0.0] 単層ガンマ線偏光計を用いた角距離$0circ-50circ$におけるコンプトン散乱による脱コヒーレンス後の消滅量子の偏光相関について検討した。
その結果, 偏光変調係数で表される相関は, 小さい散乱角では有意差は認められなかった。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 10:11:40 GMT)
Cavity-induced charge transfer in periodic systems: length-gauge
formalism [0.0] 光-物質相互作用を誘導する光子空洞の存在下での1次元周期格子系を扱うための長ゲージ形式を開発した。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 10:25:03 GMT)
Bohmian Mechanics as a Practical Tool [0.0] ボヘミア力学を計算ツールとして活用できるホットスポットをいくつか紹介する。
シュル・オーディンガー方程式は、非マルコフ開量子系の還元密度行列を計算するために用いられるが、必然的にボヘミアの条件波動関数の概念を用いるように見える。
ボヘミア力学において、コペンハーゲンの「観測可能な作用素」がボヘミア軌道の数値的性質から導出できることを紹介する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 18:55:23 GMT)
An approach to extract information from academic transcripts of HUST [0.0] 多くのベトナムの学校では、成績は依然として手動でデータベースに入力されている。
本稿では,改良CRNNモデルを用いて,126文字の情報を抽出する手法を提案する。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 17:29:55 GMT)
A study of the violation of the Bell-CHSH inequality [0.0] 両部類系におけるベル-CHSH不等式違反について論じる。
擬スピン作用素を用いて、系のヒルベルト空間のすべてのモードをペアでグループ化することができる。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 14:06:40 GMT)
A bounded rationality account of dependency length minimization in Hindi [0.0] DependenCY LENGTH MINIMIZATIONの原理は、効果的なコミュニケーションのために人間の言語の構造を形成すると考えられている。
典型的には、長短成分と後短長成分の配置は、文全体の依存長を最小にすることが知られている。
本研究では,ヒンディー語における単語順の嗜好について,主動詞の横に最短助詞のみを置くという仮説を検証した。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 13:53:50 GMT)
A Landau-Zener formula for the Adiabatic Gauge Potential [0.0] 断熱ゲージ電位が遷移確率を抑制するメカニズムについて検討する。
これらの結果は、積分可能な時間依存量子ハミルトニアンのクラスにまで拡張されることを示す。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 07:09:01 GMT)
A Deep Neural Network Deployment Based on Resistive Memory Accelerator
Simulation [0.0] 本研究の目的は、Resistive RAM(ReRAM)内でディープニューラルネットワーク(DNN)をトレーニングする過程を説明することである。
CrossSim APIは、ソリューションの正確性に影響を与える可能性のある要因を考慮して、ニューラルネットワークをシミュレートするように設計されている。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 07:29:02 GMT)
A Comparative Study of Pre-trained Speech and Audio Embeddings for
Speech Emotion Recognition [0.0] 音声感情認識(SER)には、カスタマーコールの動的分析、メンタルヘルスアセスメント、パーソナライズされた言語学習など、幅広い応用がある。
事前学習されたモデル(PTM)は、音声と音声の領域において大きな可能性を秘めている。これらのモデルから活用された埋め込みは、様々な下流タスクにおけるアプリケーションによるアルゴリズム学習のインプットとして機能する。
本研究では,4つの音声感情データセット(CREMA-D,TESS,SAVEE,Emo-DB)を用いて3つのアルゴリズムを学習し,実験的な分析を行った。
本研究の結果から, 組込みを訓練したアルゴリズムにより, 最高の性能を達成できることが示唆された。
論文参考訳(メタデータ) (Sat, 22 Apr 2023 19:56:35 GMT)