論文の概要: Development of a Evaluation Tool for Age-Appropriate Software in Aging
Environments: A Delphi Study
- arxiv url: http://arxiv.org/abs/2402.03933v1
- Date: Sun, 4 Feb 2024 12:30:47 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-07 15:08:52.001626
- Title: Development of a Evaluation Tool for Age-Appropriate Software in Aging
Environments: A Delphi Study
- Title(参考訳): 老化環境における年齢対応ソフトウェア評価ツールの開発:delphiによる研究
- Authors: Zhenggang Bai, Yougxiang Fang, Hongtu Chen, Xinru Chen, Ning An, Min
Zhang, Guoxin Rui, Jing Jin
- Abstract要約: 2000年1月から2023年4月までの研究では,技術年齢の指標を体系的に検討した。
専門家は、予備指標のスクリーニング、評価、追加、フィードバックを依頼された。
- 参考スコア(独自算出の注目度): 12.790874930053242
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Objective: We aimed to develop a dependable reliable tool for assessing
software ageappropriateness. Methods: We conducted a systematic review to get
the indicators of technology ageappropriateness from studies from January 2000
to April 2023.This study engaged 25 experts from the fields of anthropology,
sociology,and social technology research across, three rounds of Delphi
consultations were conducted. Experts were asked to screen, assess, add and
provide feedback on the preliminary indicators identified in the initial
indicator pool. Result: We found 76 criterias for evaluating quality criteria
was extracted, grouped into 11 distinct domains. After completing three rounds
of Delphi consultations,experts drew upon their personal
experiences,theoretical frameworks,and industry insights to arrive at a
three-dimensional structure for the evaluation tooluser experience,product
quality,and social promotion.These metrics were further distilled into a
16-item scale, and a corresponding questionnaire was formulated.The developed
tool exhibited strong internal reliability(Cronbach's Alpha is 0.867)and
content validity(S-CVI is 0.93). Conclusion: This tool represents a
straightforward,objective,and reliable mechanism for evaluating software's
appropriateness across age groups. Moreover,it offers valuable insights and
practical guidance for designing and developing of high-quality age-appropriate
software,and assisst age groups to select software they like.
- Abstract(参考訳): 目的: 信頼性の高いソフトウェア不適切な評価ツールの開発を目標とした。
方法:2000年1月から2023年4月までの研究から技術不適合の指標を得るための体系的レビューを行い,人類学,社会学,社会技術研究の25人の専門家を対象に,デルファイの3回の協議を行った。
専門家は、最初のインジケータプールで特定された予備指標の表示、評価、追加、フィードバックを依頼された。
結果: 品質基準を評価するための76の基準を抽出し, 11の異なる領域に分類した。
3回のDelphiコンサルテーションの完了後,評価ツール使用経験,製品品質,社会促進の3次元構造に到達するための,個人的経験,理論的枠組み,産業的洞察を参考に,これらの指標をさらに16項目の尺度に蒸留し,それに対応する質問票を定式化し,内部信頼度(Cronbach's Alpha is 0.867)と内容妥当性(S-CVI is 0.93)を示した。
結論: このツールは、年齢グループ間でソフトウェアの適切性を評価するための、単純で客観的で信頼性の高いメカニズムを表している。
さらに、高品質な年齢対応ソフトウェアの設計と開発に有用な洞察と実践的なガイダンスを提供し、好きなソフトウェアを選択するためのアシスト年齢グループも提供する。
関連論文リスト
- Evaluating the Quality of Code Comments Generated by Large Language Models for Novice Programmers [0.153119329713143]
LLM(Large Language Models)は、初心者プログラマのためのコードコメントを生成することを約束しているが、その教育効果は過小評価されている。
本研究は, GPT-4, GPT-3.5-Turbo, Llama2によるコメントの指導的品質を評価する。
論文 参考訳(メタデータ) (2024-09-22T09:03:48Z) - Analysis of the ICML 2023 Ranking Data: Can Authors' Opinions of Their Own Papers Assist Peer Review in Machine Learning? [52.00419656272129]
我々は2023年の国際機械学習会議(ICML)で実験を行った。
我々はそれぞれ2,592件の応募書を含む1,342件のランク付けを受けた。
著者によるランキングを用いて生のレビュースコアを校正するイソトニックメカニズムに注目した。
論文 参考訳(メタデータ) (2024-08-24T01:51:23Z) - State of the Practice for Medical Imaging Software [0.4349838917565205]
我々は48の候補者から29の医療画像プロジェクトを選択し、各ソフトウェアプロジェクトに対して108の質問に答えて10のソフトウェア品質を評価し、29の開発チームのうち8人にインタビューを行った。
上位4つのソフトウェア製品は、3D Slicer、ImageJ、Fiji、OHIF Viewerである。
論文 参考訳(メタデータ) (2024-05-20T16:55:05Z) - OpenPerf: A Benchmarking Framework for the Sustainable Development of
the Open-Source Ecosystem [6.188178422139467]
OpenPerfは、オープンソースエコシステムの持続可能な開発のために設計されたベンチマークフレームワークである。
データサイエンスタスクのベンチマークが3つ、インデックスベースのベンチマークが2つ、標準ベンチマークが1つ実装されています。
私たちは、堅牢なデータ管理、ツール統合、ユーザインターフェース機能を提供するOpenPerf用の包括的なツールキットを開発しました。
論文 参考訳(メタデータ) (2023-11-26T07:01:36Z) - Tool-Augmented Reward Modeling [58.381678612409]
本稿では,外部環境へのアクセスによるRMの強化により,制約に対処するツール拡張された嗜好モデリング手法であるThemisを提案する。
我々の研究は、外部ツールをRMに統合し、様々な外部ソースとの相互作用を可能にすることを目的としている。
人間の評価では、テミスで訓練されたRLHFはベースラインと比較して平均32%の勝利率を得る。
論文 参考訳(メタデータ) (2023-10-02T09:47:40Z) - Learning and Evaluating Human Preferences for Conversational Head
Generation [101.89332968344102]
そこで我々は,異なる次元の定量的評価に基づいて,人間の嗜好を適合させる学習ベース評価尺度であるPreference Score(PS)を提案する。
PSは人間のアノテーションを必要とせずに定量的評価を行うことができる。
論文 参考訳(メタデータ) (2023-07-20T07:04:16Z) - From Static Benchmarks to Adaptive Testing: Psychometrics in AI Evaluation [60.14902811624433]
本稿では,静的評価手法から適応テストへのパラダイムシフトについて論じる。
これには、ベンチマークで各テスト項目の特性と価値を推定し、リアルタイムでアイテムを動的に調整することが含まれる。
我々は、AI評価にサイコメトリックを採用する現在のアプローチ、アドバンテージ、そして根底にある理由を分析します。
論文 参考訳(メタデータ) (2023-06-18T09:54:33Z) - Empowered and Embedded: Ethics and Agile Processes [60.63670249088117]
私たちは倫理的考慮事項を(アジャイル)ソフトウェア開発プロセスに組み込む必要があると論じています。
私たちは、すでに存在しており、確立されたアジャイルソフトウェア開発プロセスで倫理的な議論を実施する可能性を強調しました。
論文 参考訳(メタデータ) (2021-07-15T11:14:03Z) - Sentiment Analysis of Users' Reviews on COVID-19 Contact Tracing Apps
with a Benchmark Dataset [6.592595861973966]
接触追跡は、新型コロナウイルスの感染率を制御する戦いで世界的に採用されています。
スマートフォンやウェアラブルデバイスなどのデジタル技術のおかげで、COVID-19患者の連絡先を簡単に追跡し、ウイルスへの潜在的な曝露について知らせることができます。
興味深いモバイルアプリケーションもいくつか開発されている。
しかしながら、これらのアプリケーションの動作メカニズムやパフォーマンスに対する懸念はますます高まっている。
本研究では,クラウドソーシングによる手動アノテーションから始めるパイプラインを提案し,ユーザのレビュー自動感情分析のためのaiモデルの開発とトレーニングについて考察する。
論文 参考訳(メタデータ) (2021-03-01T18:43:10Z) - GO FIGURE: A Meta Evaluation of Factuality in Summarization [131.1087461486504]
本稿では,現実性評価指標を評価するメタ評価フレームワークGO FIGUREを紹介する。
10個の実測値のベンチマーク分析により、我々のフレームワークが堅牢で効率的な評価を提供することが明らかとなった。
また、QAメトリクスは、ドメイン間の事実性を測定する標準的なメトリクスよりも一般的に改善されているが、パフォーマンスは、質問を生成する方法に大きく依存していることも明らかにしている。
論文 参考訳(メタデータ) (2020-10-24T08:30:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。