機械学習においてデータをよりよく理解するために、基本的な統計学の知識はとても役に立ちます。また共分散行列や主成分分析などの線形代数の演算や機械学習のメソッドを理解する上での土台にもなります。要するに、線形代数を深く理解するためにも、機械学習により精通するためにも、統計学の基本は重要であるということです。この章では、統計学の基本的な概念を紹介し、それを NumPy でどのように実装するのかを解説します。
具体的には次のことがわかります。
- 期待値や平均とは何か、どのように求めるのか
- 分散や標準偏差とは何か、どのように求めるのか
- 共分散、相関、共分散行列とは何か、どのように求めるのか
それでは見ていきましょう。