私は7000のデータインスタンスを持っています。
私はそれらのインスタンスを人間が手作業で採点しています(参考文献)。
私は自動的にデータのスコアを決定するために異なるエンジンを持っています。
私は各列にあるエンジンのスコアとマニュアルで採点されたデータの1列を記述するExcelシートを持っています。
私はどちらのエンジンがExcelの関数、プログラミングを使って人間の得点に近づいているのかを知りたいのですが、単純な数学を教えてもらうだけです。
データ採点は-3.0から+3.0
そのアプリケーションにはC#、Excelシートには.NET ExcelのCOMライブラリを使用します。
-更新-
統計的に言えば、エラーを説明する最善の方法は人間のスコアが中立(0)に近づく傾向があることを意味しますが、エンジンのスコアは偏っている傾向があります(1.5 +/-を超える)。適切な方法でエラーを説明して誇張する最良の式です。