第10回経済情報論

経済情報論

第10回　ダミー変数

（P146）表１は、わが国の水稲の収穫量Yと作付面積Xの推移を、１９８５年から９５年の１１年間について示したものです。
(1)ヨコ軸にX、タテ軸にYをとり、このデータの散布図を描きなさい。
(2) つぎの単純回帰モデルをOLSにより推定し、t値、Ｐ値と決定係数も計算しなさい。

(3) １９９３年は記録的な冷害にみまわれ、水稲の作況指数は戦後最悪（７４）、未曾有の不作の年となりました。そこで、１９９３年をD＝１、その他の年をD＝０とする一時的ダミー変数を導入した、つぎの重回帰モデルを推定しなさい。ｔ値、Ｐ値と自由度調整済決定係数もあわせて計算しなさい。

(4) （2）と（3）を比較して以下の質問に答えなさい。
①どちらのモデルが当てはまりがよいと思われますか？またその理由を答えなさい。
②ダミー変数を導入した効果はあったと思いますか？またその理由を答えなさい。

(1)、（２）は今までの復習なので結果だけ表示します。自分の結果とあっているか確認してください。

Ｅ列にダミー変数を入力して重回帰分析を行います。
ダミー変数には１９９３年以外は「０」、１９９３年には「１」と入力していきます。
まず「Ｅ１」には｢ダミー変数」と入力しましょう。
また「Ｅ２」には「０」と入力しましょう。
「Ｅ２」をコピーし、１９９３年以外に貼り付け、１９９３年には「１」と入力します。

エクセル統計で重回帰分析を行います。

目的変数は単回帰分析と同じＣ列を指定します。
説明変数は作付面積のＤ列と作成したダミー変数のＥ列を指定します。
変数選択はダミー変数を用いる場合は行ってほしくはないので「全変数」とします。
「ＯＫ」を押すと結果が表示されます。

（２）、（３）の結果から比較して答えます。

当てはまりのよさを測るのは決定係数でした。比較する場合は値が大きくなっていればあてはまりがよいといえます。この場合は重回帰分析も行っているので修正済決定係数で比較します。
（２）と（３）では（３）のほうが決定係数の値が高いため、こちらのほうがよいモデルといえます。

（３）　理由；修正済決定係数を比較すると（２）のモデルでは０．７６７２、（３）では０．８４０９となっていて（３）のほうが高くなっているため
ダミー変数を導入した効果があるかは回帰係数β_２に関する仮説検定を行います。

もし帰無仮説が棄却されなければ、ダミー変数がどんな数値であろうと結果には影響されません。仮説検定の結果はＴ値、Ｐ値を見ます。特にＰ値は

Ｐ値	結果
０．０５以上	棄却されない
０．０１以上０．０５未満	５％有意
０．０１未満	１％有意

となります。ダミー変数のＴ値、Ｐ値は４．０３９６、０．００００３となっているのでＰ値が０．０１未満で１％有意で棄却されます。よってダミー変数を導入した効果があったといえます。

効果はある。Ｐ値が0.01未満であるため1％有意でダミー変数の説明力があると判断されたため

表２の四半期データは、わが国の食費総額（食品・飲料・煙草）Yと国内家計最終消費支出Xの推移を、実質額で示したものです。
(1) 次のモデル（マクロのエンゲル関数）を、OLSにより推定しなさい。また、t値、Ｐ値と自由度調整済決定係数も計算しなさい。

(2) 季節ダミー変数（第１四半期）、（第２四半期）、（第３四半期）を導入した以下のモデルを推定しなさい。t値、Ｐ値と自由度調整済決定係数もあわせて計算しなさい。

(3) （2）の結果について以下の問いに答えなさい。
①どちらのモデルが当てはまりがよいと思われますか？またその理由を答えなさい。
②ダミー変数を導入した効果はあったと思いますか？またその理由を答えなさい。

結果として重要なのは以下の部分です。解答欄に以下の部分を貼り付けましょう。

まずは季節ダミー変数を作成しなければなりません。作成方法としては以下のように考えます。

	D1	D2	D3
第1期	1	0	0
第2期	0	1	0
第3期	0	0	1
第4期	0	0	0

昭和55年のところに上の表のように数値を入力します。

作成した昭和55年のダミー変数をコピーし、E列からG列の残りの部分に貼り付けをします。

重回帰分析を行います。（変数選択は全変数）

結果として重要なのは以下の部分です。解答欄に以下の部分を貼り付けましょう。

①、②は例題1と同様に答えます。

（２）　理由；修正済決定係数を比較すると（１）のモデルでは０．４２３３、（２）では０．９１５９となっていて（２）のほうが高くなっているため
効果はある。理由；どのダミー変数もＰ値が0.01未満であるため1％有意でダミー変数の説明力があると判断されたため

表3は2000年における47都道府県における実質県民所得Ｙ（平成７暦年価格）（１０億円）と労働力人口（千人）Ｘを表したものである。都道府県データを用いて労働力による生産力に関する分析を行いたい。特に労働力の大きさにより所得に影響しているのかを分析したい。そこで以下の問いに答えなさい。また、推定に関してはt値、Ｐ値と自由度調整済決定係数も計算しなさい。
(1)つぎのモデルを、OLSにより推定しなさい。

(2)政令指定都市の有無について次のダミー変数を用いて次のモデルを推定しなさい。

①定数項ダミーを導入したモデル：
②係数ダミーを導入したモデル：
③定数項ダミー、係数ダミーを導入したモデル：
(3)（１）から（２）までの結果を見て以下の問いに答えなさい。
①どのモデルが最も当てはまりがよいと思われますか？またその理由を答えなさい。
②ダミー変数を導入した効果はあったと思いますか？またその理由を答えなさい。

結果として重要なのは以下の部分です。解答欄に以下の部分を貼り付けましょう。

政令指定都市は以下の都市があります。これに東京都を加えた１２都道府県を１として残りを０とします。

都市名	都道府県名
札幌市	北海道
仙台市	宮城県
さいたま市	埼玉県
千葉市	千葉県
横浜市	神奈川県
川崎市	神奈川県
名古屋市	愛知県
京都市	京都府
大阪市	大阪府
神戸市	兵庫県
広島市	広島県
北九州市	福岡県
福岡市	福岡県

「DX」を入力するE列には「C列の値」×「D列の値」を出力されるようにします。
たとえば北海道の「E3」には
＝C3＊D3
と入力します。
この関数を他のE列にコピーすれば出来上がりです。

エクセル統計を使う場合には説明変数は隣り合っていたほうが指定しやすくできます。そこで①から③までの説明変数をまとめておきましょう。
それぞれに対して重回帰分析をおこなって結果を出力させてください。
3行目だけコピーする

G列からO列まですべてにコピー

①の結果

②の結果

③の結果

①、②は例題1、２と同様に答えます。

（２）の③　理由；修正済決定係数を比較すると（２）の③が０．９０５０と最も高くなっているため
効果はある。理由；（２）③のモデルでは、ダミー変数X,DXがともに1％有意でダミー変数の説明力があると判断されたため

表４は1983年から2002年までの家計における可処分所得Ｘと消費支出Ｙを示しています。
(1) ヨコ軸にX、タテ軸にYをとり、このデータの散布図を描きなさい。
(2) つぎの単純回帰モデル（消費関数）をOLSにより推定し、t値、Ｐ値と決定係数も計算しなさい。
①　
(3) １９９３年にバブル崩壊後、日本経済は不況が続きました。特に1995年からはデフレ経済などといわれていました。このような不況により家計に構造変化があったのかを分析してみます。そこで以下のダミー変数を導入したモデルについて推定しなさい。なお、どの分析でもＰ値と自由度調整済決定係数もあわせて計算しなさい。

②
③
④
(4)(２)と(３)の結果を見て以下の問いに答えなさい。
①どのモデルが最も当てはまりがよいと思われますか？またその理由を答えなさい。
②ダミー変数を導入した効果はあったと思いますか？またその理由を答えなさい。

例題３に関連して関東地方とそれ以外の地方で労働力と所得の関係が異なるかを分析したい。
(1) 関東地方とそれ以外について次のダミー変数を用いて次のモデルを推定しなさい。

① 定数ダミーを導入したモデル：
② 係数ダミーを導入したモデル：
③ 定数項ダミー、係数ダミーを導入したモデル：
(２)　関東地方とそれ以外では労働力の大きさと所得の関係の構造変化はありますか？もしあるとしたらどのような変化があるのかを述べなさい。

表５は2000年における47都道府県におけるコンビニエンススト店舗数Ｙと人口Ｘを表したものである。都道府県データを用いてコンビニ店舗数に関する分析を行いたい。そこで以下の問いに答えなさい。また、推定に関してはＰ値と自由度調整済決定係数も計算しなさい。
(1)つぎのモデルを、OLSにより推定しなさい。：
(2)政令指定都市の有無について次のダミー変数

を用いて定数項ダミー、係数ダミーを導入したモデルを推定しなさい。

（３）　ダミー変数を導入した効果はあったと思いますか？またその理由を答えなさい。