統計について述べるときここでは「統計」とは統計全体の広い意味で用いています。
データとしての統計は統計量、理論・学術としては統計学、計算式やそのプロセス、技術については統計的手法、といった用語がありますが、それら全てを法有する広い概念として「統計」と記載します。
統べて計るですから、全体や全体のために計算する意を持つ統計とは何であって、何のためにあるのか。
我々は未来をより良いものにするために現在の状況を理解しようとします。自分自身、友達、家族、目の前の他人、株価、交通渋滞、電車の遅延、テストの出題範囲、顧客の真の要求内容…。時にそれは自分一人ではなくチームやより大きな集団で共有したり、あるいは過去との比較を行い、未来に向けての判断材料とします。そのため主観ではなく客観的な情報、定量化が必要になります。
定量化された情報、例えば株価であれば〇〇会社の今日の株価も気になりますが、より多く使われるのは日経平均でしょう。日本経済新聞が取り上げた代表銘柄の平均値を用いることで、株価全体が上昇傾向なのか、ひいては日本経済は好調なのか、あるいは現政権は経済を成長させてくれるのか、などの現在の一側面の特徴を示しています。
同じくして我々人間の集団としての状態を理解することも重要です。コロナ禍のある年代の健康状態、中小企業の従業員のメンタルヘルス、成人女性のがん罹患率、多くの状況を理解することで、集団としてうまくいっているのか、改善しているのか、課題が多いのかを理解し、未来への対策をとります。その判断材料として人々の血圧を取り、ストレス度チェックを行い、がん検診の結果をまとめます。
こうして得られた値が統計値です。統計はこのように客観的、すなわち多くの人が共有できる数値で人々や製品、自然等の集団的、集合的状況の特徴を理解するために用いられます。
統計には集団・群のデータが必要です。解釈できる統計にするためには設計されたデータ収集方法と分析手法が重要です。統計値として得られた結果は集団の分布や特性を明らかにするために用いられ、客観的な数値で社会や現象、集団を表すもの、として解釈されます。厚生労働省は統計の重要性をまとめています。以下厚労省「統計の重要性とは」からまとめますと、公的統計は、経済・人口・社会・環境の状態について、民主的な社会情報システムの不可欠な要素であり、公正にまとめられ利用される科学的かつ倫理的なデータである。「統計の整備は、日本再建の基礎事業中の基礎事業」とされ、19世紀仏統計学者モーリス・ブロックの「国家の存するところ統計あり」という言葉を引用している。過去を振り返り、今を知り、未来を見通す指標であり社会を発展させる基礎と位置付けられています。
そのまとめた結果は平均値、分散、標準偏差、感度・特異度、罹患率等の統計値や特徴量と呼ばれる集団の特徴を表した値となります。こうしたある集団を計測した結果をまとめた内容、行為を統計と言います。