エクセル編



ウォーミングアップ

 情報システム学科の入学前演習の課題です。グループで協力しながら、課題1〜3まで全員が行ってください。 そして課題3についてレポートを作成してください。グループで意見を交換し、お互いの頭を活用しますが、 レポートは各自でまとめてください。レポートにはグループでの議論を載せ、さらに自分の考えを展開して ください。この課題3については、皆さんの「エクセル編のwebページ」に掲載してください(この情報処理演習 で学ぶことはコンピュータの操作に限りません。何が重要か考えてください。)。

 先々週申しましたとおり、今日までとは申しませんが、HTML編もまとめておいてください。「CSS編課題」 を必ず含んでください。グループ単位で評価します。 HTML編の課題が残っている方は、エクセルのウォーム アップ編終了後、HTML編のまとめに取り組んでください。どちらも終了した方は、小宮山に報告後、お帰り いただいて結構です。


2006年2月7日 情報システム学科入学前演習 インターネットとデータ解析
     
ココロを読み解き 化粧品を企画しよう!:インターネットの化粧品評価サイト@cosmeのコメント分析
インターネットとデータ解析課題(2006.02.07)
データ(2006.02.07)

エクセルの機能

 何ができるかを知っておくことは、大切です。何ができるかを知っておけば必要なときに「使い方を調べよう」ってなりますが、 何に使えるかもわからなければ、調べる気にもなりません。分類の仕方は目的によって変わりますが「文系の利用法」という目的 から大きく、3分類にしてみました。

  1. データベース機能
  2. 表・図形描画機能
  3. シミュレーション

1.のデータベース機能は文系にとって、わかりやすい機能・目的です。卒業論文等、文献一覧を作るときに大変便利です。 論文の一般的な文献一覧の作成法に従って自分の文献データベースを作成しよう!

もう、ゼミで文献一覧の作り方は習いましたか。 日本社会学会のホームページに社会学評論のスタイルガイド掲載されています。これが論文執筆の際の文献一覧や引用の仕方等、大変、網羅的に解説がしてあります。具体例も示されていて大変便利です。まずはこのスタイルガイドで文献一覧にはどのような情報を、どのような順番で書くのか調べましょう。

エクセルで文献データベースを作ろう!

項目を設定しよう

行ごとに書籍の情報が並び、列にさまざまな項目が並ぶようにします。一列目は番号として通し番号を打ちましょう。 あとで、データベースを使用するとき、文献の並べ替えを行いますが、通し番号を打っておくと、元の並び順に すぐに戻せます。

スタイルガイドにしたがって必要な項目を並べておきます。そのあとに著者のアルファベットのイニシャル・50音の頭文字 の項目を作っておくと便利です(なくてもアルファベット順・50音順に並べ替えてくれるのですが、外国語文献と日本語文献 が混じっているときはこれがあると便利です)。

皆さんはさまざまな講義・演習で文献を読むと思います。また皆さんがこの大学で追求するひとつの問いにたどり着くまではさまざまなテーマにチャレンジすると思います。「講義・演習名」「分類(未来の自分がわかり、便利な分類の仕方をしよう)」という項目を作っておこう。あと「読んだ日付」「データベースに掲載した日付」の項目も作っておくと便利です(日付をわすれた文献は空欄にしておけばいいでしょう)。さらに「一言コメント」(こんなときに役立つ!等)の項目を作っておくと、未来の自分がきっと今のあなたに感謝します!

データを入力しよう!

本学図書館の検索システムや全国の大学の検索システム(Web Cat:本学図書館にリンク)を使って、皆さんが読んだ、または 皆さんが興味のある書籍のデータベースを作ろう。あと国会図書館のデータベース、雑誌記事索引は、論文集の中のひとつひとつの論文が検索できます。これもとっても便利。

作ったデータベースを使ってみよう

文献表は、講義・演習・卒論等、目的によってデータベース全体の一部を表にすることになると思います。そんな時「並べ替え」や「フィルター」の機能が便利です。文献表は、アルファベット順または50音順にならべ、同一著者が複数ある場合、年代順に並べます。「並べ替え」や「フィルター」の機能を使って文献を並べ替えて、データベースからコピーしワードに貼り付けて、社会学評論のスタイルガイドにしたがった文献一覧を作ってみましょう。

付録:VBAでプログラミング入門!

簡単マクロ

  1. ツール→マクロ→新しいマクロの記録→OK
  2. 一連の作業 今回:各自がExcel編で作成した文献一覧の並べ替え
      講義・著者名(アルファベット順)・年代(降順)で並べ替えよう
  3. 記録終了をクリック
  4. ナンバー順で並べ替えた後、マクロを実行してみよう!
  5. ツール→マクロ→(今作成したマクロを指定して)実行
  6. ナンバー順で並べ替えるマクロも作成しよう!
  7. ボタンを作成しよう! 表示→ツールバー→フォーム
  8. ボタンのアイコンをクリックして、マクロを指定してOKをクリック
  9. ボタンののところで右クリックでテキストの編集で名称を変更。
  10. 講義・著者名(アルファベット順)・年代(降順)で並べ替えるボタンと、またナンバー順に戻すボタンを作成しよう!

VBA(Visual Basic Applications)

  1. 今、作成したマクロはVBAで書かれています!
  2. ツール→マクロ→Vsual Basic Editor
  3. 標準モジュールをクリック
  4. 一連の作業をVBで記録してくれていたのです。
  5. 自分でVBでプログラムすることもできます。

表・図形描画編

データのダウンロード

議論をするとき、データがあると具体的に考えることができます。議論のポイントがわかるようにデータを分析し、「なぜ〜なんだろう」という問いを見つけることが大切です。さらに議論で意見が対立したときにどちらの意見がデータとあっているか決着がつくように、データを分析しましょう。

以下のURLからデータをダウンロードしてください。

http://www.nuis.ac.jp/~komiyama/data.xls

選挙に関するデータは新潟日報社のホームページ、その他のデータに関しては『民力CD-ROM(2001年度版)』が出典です。民力のCD-ROMは本学図書館に所蔵されています。選挙データは2001年参院選挙新潟選挙区の市町村別の投票結果です。その他のデータは主に1995年の国勢調査報告書が原典です(詳しくは民力参照〜論文では原典を必ず記述してください。またデータに誤りがないか原典でチェックしてください)。

計算式の編集(式の計算・関数)

次のことを調べよう!

1)トップ当選したのは誰だろうか? 2番目は?
2)トップ当選した候補者は、どの市町村でもトップ当選したのだろうか?
  同様に2番目の当選者についても調べよう。

グラフの作成

適切なグラフ表現をする。グラフを作成するためにデータを加工する

1)連続データの入力(次に行なう「データの並び替え」後またもとの順に戻せるように番号を振っておく。)
2)データの並び替え  得票率順に市町村を並び替える。
3)グラフ
 2)のデータを用いて市町村別の得票率のグラフを作成する。

練習1

1)各市町村ごとの第一次産業就業者割合・第ニ次産業就業者割合・第三次産業就業者割合を計算してください。
2)各産業就業者割合とまじま得票率の関係を表すグラフを作成する。
 

仮説の検討


1.原因と結果の間のプロセスの検討
「第[ ]次産業就業者の割合の高い地域で真島氏は得票率が高い傾向が見られた」という現象が起きるプロセスを考えてみよう。

悪い例(原因と結果のプロセスが不明確)
真島氏は農村部で支持された。

良い例(原因と結果のプロセスが明確)
真島氏は県議・市議の自民党議員の選挙協力を得られた。自民党は農業従事者の間で支持者が多い。そのため真島氏は農業従事者から多くの支持を得た。したがって農業従事者が多い市町村ほど、真島氏は多くの得票を得た(農業説)。

練習2

まじま得票率の市町村間の相違を説明する仮説を考えて見よう! グループで知恵を出し合い2つ以上の仮説を考えよう。そして練習1の1)のように変数を作成し、そして練習1の2)で用いたグラフを描いてみよう。(エクセルで構わないので。記録しておいてください。あとでパワーポイントやワードにまとめます。)

2.別の要因の検討
1.で考えたプロセス以外の原因以外で、真島氏が「第[ ]次産業就業者の割合の高い地域で真島氏は得票率が高い傾向が見られた」という結果が得られる場合を考えて見よう。

悪い例(「第[ ]次産業就業者の割合の高い地域で真島氏は得票率が高い傾向が見られた」という結果と矛盾している)
真島氏は都市部で支持された。

良い例(「第[ ]次産業就業者の割合の高い地域で真島氏は得票率が高い傾向が」という結果の原因となっている)
真島氏は県議・市議の自民党議員の選挙協力を得られた。自民党は高齢者の間で支持者が多い。高齢者が多い市町村ほど、真島氏は多くの得票を得た(高齢者説)。農業従事者は高齢者が多い。そのため、第一次産業従業者比率と真島氏の得票率はある程度、相関関係が見られたが、それは疑似相関である。

練習3

練習2で考えたそれぞれの仮説を主張する立場から、もう一方の説が疑似相関であるという主張をしよう。 (エクセルで構わないので。記録しておいてください。あとでパワーポイントやワードにまとめます。)

3.検証
「疑似相関を見破る」(苅谷剛彦 1997:138-145)を参考に、ウォーミングアップ編で習得したピボットテーブルを使い、どちらの変数が、疑似相関か見破ってください。

農業説と高齢者説

  1. 第一次産業就業者比率について降順でソートしてください。第一次産業就業者比率の隣に列を挿入し、1位〜55位までを「第一次産業就業者比率高い」とし56位〜111位を「第一次産業就業者比率低い」とした、新しい変数「第一次産業就業者比率高低」を作ろう。
  2. 同様に「高齢者比率高低」という変数を作ろう。
  3. ウォーミングアップ編を参考に高齢者比率を行、第一次産業就業者比率を列とし、データアイテムをまじま得票率の平均値とした表を作成しよう。
  4. 「疑似相関を見破る」(苅谷剛彦 1997:139)の表2・表3を参考に、どちらが疑似相関であるか、考えてください。
・これは平均値を用いた簡単な仮説の検討方法です。厳密には、多変量解析(重回帰分析・分散分析等)を行い統計的検定によって検証する必要があります。本学の講義(社会理論と調査法・生活統計・地域統計・多変量解析法等)で修得できます。また今回のデータは集合データ(市町村ごとのデータ)です。厳密には個人ごとのデータで分析する必要があります。個人ごとのデータの集め方は長坂さんの社会調査や実習で学べます。


練習4

皆さんの立てた仮説の中から、二つを選び、上記のように、検証してみよう。


 当時、全国紙では小泉旋風が自民党の勝因であると報道していました。しかし、本学の越智先生は まったくことなる説を唱えていました。真島氏は小泉首相の唱える“小さな政府”とは、逆行する さらなる社会資本の整備を主張していたからです。  まだまだ十分に道路等がいきわたっていない、そして過疎化が進む地域の人々が、彼の主張を支持 したいのではないか? 新潟県民は東京都民とは違う理由で自民党に投票したのではないか? 疑問 をもったっとき、その疑問の解決のひとつの手段としてコンピュータを使えるようになってください。 (「道路を作って新潟が救われるか」これはまた別のお話。「情報社会論」でお話します。)


参考文献
苅谷剛彦,1997,『知的複眼思考法』講談社. データベース編で作成した文献データベースに上記の参考文献を加えておいてください。そしてエクセル編のWebページにリンクしてください。

課題

これまでのところをエクセル編にまとめてください。3年後の卒論に取り組んでいる自分が文献データベースを作ったり、疑似相関を見破れるように記述してください。未来の自分へのプレゼントです。なお、エクセル編の演習結果(データベース・仮説検証)のファイルをアップロードし、エクセル編にリンクしてください。

課題

 

パワーポイント編を参考に今回の結果からプレゼンテーションの資料を作ろう。

注意:仮説は、抽象的なものです。抽象的なものは難しいです。だからこそ、なるべく“具体的”にプレゼンテーションしましょう。どんな人が、どんな気持ちで真島氏に投票した結果、私たちが始めに観察した市町村別の真島得票率の分布が出来上がったのかをビジュアルに表現してください。文字の羅列だけのプレゼンはやめましょう! グラフ・表・図解を駆使してください。パワーポイントの操作は簡単ですが、良いプレゼンに効果的に使うのは大変難しいです。しかしだからこそ練習してください。


パワーポイント編



課題

パワーポイント編をWebページにまとめてください。3年後の卒論に取り組んでいる自分が「発表することは何か、どのように資料を作成すべきか」で迷わないように記述してください。ここで作成したパワーポイントのファイルをアップロードし、パワーポイント編にリンクしてください。