知識情報
2024

スケジュール、課題

金曜 1限 240教室
課題を授業時間中に1回以上フォームから送信すると、その日の授業は出席となります。
日付 内容 提出物
4月12日
データマイニングとPythonプログラミングの入門
この下にある「プログラミング開発環境」を見て、ColaboratoryでPythonプログラムを実行できるようにしてから、課題を行ってください。
課題
4月19日
ディシジョンツリーの概要
課題
4月26日
ディシジョンツリーのプログラミング基礎
課題
5月10日
Pythonのデータ分析ライブラリPandas
課題
5月17日
Pythonによるデータ構造の表現
課題
5月24日
情報エントロピー
課題
5月31日
ディシジョンツリーの生成
課題
6月7日
ここまでのまとめ
課題
6月14日
ExcelファイルのPythonによる操作例(1)
課題
6月21日
ExcelファイルのPythonによる操作例(2)
課題
6月28日
ExcelファイルのPythonによる操作例(3)
課題
7月5日
ExcelファイルのPythonによる操作例(4)
課題
7月12日
ExcelファイルのPythonによる操作例(5)
課題
7月19日
ExcelファイルのPythonによる操作例(6)
課題
7月26日
ここまでのまとめ
課題
8月2日
レポートの提出

プログラミング開発環境

成績評価基準

  • 1回分の授業中課題: 5点、15回の授業で 5 * 15 = 75点となる。
  • レポート: 25点
  • 出席は、授業中の課題を提出すると出席となります。
  • 5回欠席をするとF評価となります。
  • レポート未提出だとE評価となります。

この授業の目標

  • Pythonで0からディシジョンツリーを作成する。詳細は、 Qiitaにあげた記事を参照のこと。
  • 自分自身の問題を、プログラミングによる情報技術で解決することを学ぶ。

レポート

  • 目的: ExcelファイルをPythonでデータ分析する。
  • 提出期間: 第14回の授業終了後(2024.7.19 10:30)~8.2 10:30 まで
  • 提出方法: データのExcelファイル、レポートのパワーポイントファイルを提出サイトからアップロードする。
  • レポートの評価基準
    • できた/できない、ではなくてレポートにかけた時間で評価したいです
      • 例えばデータをネットで探してダウンロードするよりも、自分でアンケート等で作成する方が大変なので、後者の方が点数が良い。
      • 1度ダウンロードして検討したけどよく分からなくてそのデータは諦めた、ということもレポートにかけた時間なのでレポートにそのことを記載して欲しいです。
      • データを読み込むプログラムを時間をかけて作った、分析で色々と考えた、などレポートにかけた時間が分かるように記載されていると良いです。
      • 分析結果が素晴らしいのはもちろん評価対象ですけど、プログラムが動かなくて分析はできなかったという結果でもそれまでの過程で十分に時間をかけていることがレポートから読み取れれば、レポートの得点としては満点にもなります。
    • データについて
      • データをどこで取得したか、またはどのように作成したか
      • なぜそのデータを扱おうと思ったか(例えば、○○に興味がある、レポートして扱いやすいデータだった、など)
      • データの説明がされているか(例えば人口データなら行は全国を含む各都道府県、列は1920年からの男女および総数、など)
    • データの前処理(プログラムを実行する前にExcelで行う操作とExceファイルを読み込んだ後のDataFrameの整形)について
      • 前処理を行う理由が明記されているか(例えば、ディシジョンツリー作成のために離散化する必要がある、など)
      • 前処理で行ったことを説明しているか
    • データ分析のPythonプログラムについて(以下は1回だけでなく、なんども繰り返されることが望ましいです。レポートには時系列で記載されていればOKです。)
      • データ分析の目的が示されているか(例えば、とりあえずよく分からないのでグラフ化してみる)
      • プログラムの説明があるか
      • 実行結果が示されているか
      • (可能なら)結果から次の目的を立てて分析が繰り返されているか
    • 考察(ここまでは自分が行った作業を記録したもの、この考察だけがその結果からの意見を言うところ)
      • 分析から分かったこと、または分からなかったことが示されているか
      • 今後にデータ分析を続ける場合、何に気を付け、何をすれば良いかが書かれているか

C言語とPythonの違い: 「3 4 5」と出力されるプログラムの場合

Pythonの場合
C++の場合

X(Twitter)からの情報