データ活用 正解率とは?デジタル変革における機械学習モデルの評価
正解率は、機械学習の性能を測る基本的な尺度です。これは、全データのうち、どれだけ正確に予測できたかの割合を示します。例えば、百個のデータで八十個を正しく分類できれば、正解率は八割です。直感的で分かりやすく、初期評価や比較に役立ちます。ただし、正解率は全体的な性能を示すに過ぎず、詳細な分析には別の指標も必要です。特に、データに偏りがある場合、例えば、特定の種類のデータが極端に多い場合、正解率だけでは正確な評価ができません。病気の診断を例にすると、罹患者が少ない場合、常に「病気ではない」と予測するだけでも高い正解率になる可能性があります。このような場合、適合率や再現率を用いることで、病気の人をどれだけ正確に検知できるかを評価します。正解率は、機械学習モデルを適切に評価し、事業課題の解決に繋げるための第一歩として重要です。
