| 学会誌・論文集 トップへ | |
|
|---|---|---|
| 1/9 | |||||
| 空気調和・衛生工学における数学の利用(7) 統計学の基礎
|
|
||||
|
はじめに 統計学は,サイコロ賭博に関するパスカル(Blaise PasCal,1623〜1662)の考察から始まったとするのが,通説である。やがて,ガウス(Carl Friedrich Gause,1777〜1855)が天体の観測データを分析する中で正規分布を考案,ゴゼット(William Gosset,1876〜1937)はビール工場での品質管理を行っているなかでt分布を発見し,フィッシャー(Ronald Fisher,1890〜1937)は農場における肥料や農薬の適正な投与を決定するために実験計画法を編み出した。このように,統計学において用いられているさまざまな手法は,常に測定や生産の現場において,実務家の手で産み出されたものであり,現実の問題に対処するための英智がこめられた非常に実賎的な道具なのである。残念ながら,理学・工学系の分野の中で最も統計的な考え方が浸透していないのは,建築学の分野ではないだろうか。建築学の分野では,実験や調査で得られた結果について,統計的な考察を行っていることが非常に少ない。一方で医学・化学・物理・農学などの分野では,実験や実測で得られた結果について,統計学を用いて,その有効性を検討することが,常識的に行われている。 建築においても,人命という最もクリティカルな問題に向き合っている構造・防災の分野では,安全性と経済性のバランスを確率的に扱うことが,徐々に広まりつつある。我々が携わっている建築環境の分野でも,暖冷房熱負荷や給水負荷などの日々刻々と変動する対象を統計的に扱う手法が少しずつではあるが,用いられるようになってきている。 本講座は,建築環境工学にかかわる方々を対象に,統計学の基本的な知識を見ていく中で,興味を持っていただくことを趣旨としている。統計学に関する優れた書物はすでに数多くあるので,本稿ではなによりも統計学に親しみを感じていただくことに重点をおいて,数学的な厳密さにこだわらず,実際の実測データや簡単なシミュレーションを用いて実賎的に解説する。 なお,統計学は極めて広大かつ深遠な学問であるため,ここでは環境工学と特に関係の深い,“統計的推測”と呼ばれる手法のみ扱うこととする。 まず,実際の計測データを対象に,度数分布の整理,平均や分散などの分布の統計量の算出といった,基本的な処理を説明する。次いで,非常に重要にもかかわらず初学者がつまづきやすい,“母集団と標本”の考え方を特に詳しく扱う。次いで,母集団の確率分布として,正規分布などの代表的な確率密度関数を概観する。最後に環境工学分野への応用例として,器具の同時使用率や待ち行列について,その導入を行っている。 1.度数分布とヒストグラム 統計学の学習においては,実際にデータを扱いながら学ぶことが最も効果的である。ここでは建築環境・設備に関係した調査例として,ある住戸で実際に計測された給水消費量の実測データを対象に,基礎的な統計処理を行っていくことにしよう。
図−1をみると,900l/(日・戸)程度を中心に,日々消費量が変動している様子が伺える。統計学の重要な対象の一つが,このような一見ランダムに変動するデータである。1年間を通しての消費量の変動状墳を把握するために,ここでは100l/(日・戸)間隔で,消費量別該当日数をカウントしてみると,表−1のようになる。それぞれの間隔を“階級”と呼び,その階級を代表する値(通常は最大値と最小値の平均)を“階級値”,各階級にカウントされた該当データ数を“度数”と呼ぶ。例えば,750〜850の階級の代表値は800,度数は114であり,800l/(日・戸)で代表される750〜850l/(日・戸)の範囲に該当するのが114日あったことを表している。表−1のような度数を整理した表を,“度数分布表”と呼ぶ。
なお,度数分布はあるサンプル数(この場合は365)のデータに関する結果なので,サンプル数が異なるデータ同士を比較するには不便である。そこで,度数を全サンプル数で割ったものを,“相対度数’’と呼ぶ。750〜850l/(日・戸)の階級の相対度数は,度数114を365で際して,31.2%となる。当然,相対度数の全階級にわたる合計は,必ず100%になる。
〜850l/(日・戸)が120日近くと最も多くピークになっており,それよりも消費量が多い日・少ない日は,ピークから離れるに従って減少していることがわかる。 こうして得られた図−1と表−1,図−2から,この家の水消費量の動向について整理しておこう。まず図−1より,“水消費量は日々変動しており,正確に事前予測をすることはできそうにない”と予測される。これを“ランダム性”と呼び,まず第1に認識すべき重要な性質である。 しかし,ランダム性を認めたとしても,表−1,図−2より,“750〜850l/(日・戸)の日が最も多い”,“650〜750l/(日・戸)や850〜950l/(日・戸)の日も十分ありうる”,“そこから大きくはずれる可能性は少ない”といった,全体的な傾向を指摘することはできる。 統計学をいくら駆使しても,ランダム性を有する対象を完全に把握することはできない。しかし,全体として予測の精度を高めることはできる。このような簡単な例にも,この重要なポイントが現れている。 |
| このページの先頭に戻る |