知識情報
2024
スケジュール、課題
金曜 1限 240教室
課題を授業時間中に1回以上フォームから送信すると、その日の授業は出席となります。
回 | 日付 | 内容 | 提出物 |
---|---|---|---|
4月12日 |
データマイニングとPythonプログラミングの入門
この下にある「プログラミング開発環境」を見て、ColaboratoryでPythonプログラムを実行できるようにしてから、課題を行ってください。
|
課題 | |
4月19日 |
ディシジョンツリーの概要
|
課題 | |
4月26日 |
ディシジョンツリーのプログラミング基礎
|
課題 | |
5月10日 |
Pythonのデータ分析ライブラリPandas
|
課題 | |
5月17日 |
Pythonによるデータ構造の表現
|
課題 | |
5月24日 |
情報エントロピー
|
課題 | |
5月31日 |
ディシジョンツリーの生成
|
課題 | |
6月7日 |
ここまでのまとめ
|
課題 | |
6月14日 |
ExcelファイルのPythonによる操作例(1)
|
課題 | |
6月21日 |
ExcelファイルのPythonによる操作例(2)
|
課題 | |
6月28日 |
ExcelファイルのPythonによる操作例(3)
|
課題 | |
7月5日 |
ExcelファイルのPythonによる操作例(4)
|
課題 | |
7月12日 |
ExcelファイルのPythonによる操作例(5)
|
課題 | |
7月19日 |
ExcelファイルのPythonによる操作例(6)
|
課題 | |
7月26日 |
ここまでのまとめ
|
課題 | |
8月2日 |
レポートの提出
|
プログラミング開発環境
- Google Colaboratory (Google Driveにつながります) (オンラインのPython開発環境)を使用します。Googleアカウントを作成しておいてください。
- Google Colaboratoryの使い方は、Google ColaboratoryでOpenCVをためす記事の1. Google Colaboratoryにつなげます、を参照してください。
成績評価基準
- 1回分の授業中課題: 5点、15回の授業で 5 * 15 = 75点となる。
- レポート: 25点
- 出席は、授業中の課題を提出すると出席となります。
- 5回欠席をするとF評価となります。
- レポート未提出だとE評価となります。
この授業の目標
- Pythonで0からディシジョンツリーを作成する。詳細は、 Qiitaにあげた記事を参照のこと。
- 自分自身の問題を、プログラミングによる情報技術で解決することを学ぶ。
レポート
- 目的: ExcelファイルをPythonでデータ分析する。
- 提出期間: 第14回の授業終了後(2024.7.19 10:30)~8.2 10:30 まで
- 提出方法: データのExcelファイル、レポートのパワーポイントファイルを提出サイトからアップロードする。
- レポートの評価基準
- できた/できない、ではなくてレポートにかけた時間で評価したいです
- 例えばデータをネットで探してダウンロードするよりも、自分でアンケート等で作成する方が大変なので、後者の方が点数が良い。
- 1度ダウンロードして検討したけどよく分からなくてそのデータは諦めた、ということもレポートにかけた時間なのでレポートにそのことを記載して欲しいです。
- データを読み込むプログラムを時間をかけて作った、分析で色々と考えた、などレポートにかけた時間が分かるように記載されていると良いです。
- 分析結果が素晴らしいのはもちろん評価対象ですけど、プログラムが動かなくて分析はできなかったという結果でもそれまでの過程で十分に時間をかけていることがレポートから読み取れれば、レポートの得点としては満点にもなります。
- データについて
- データをどこで取得したか、またはどのように作成したか
- なぜそのデータを扱おうと思ったか(例えば、○○に興味がある、レポートして扱いやすいデータだった、など)
- データの説明がされているか(例えば人口データなら行は全国を含む各都道府県、列は1920年からの男女および総数、など)
- データの前処理(プログラムを実行する前にExcelで行う操作とExceファイルを読み込んだ後のDataFrameの整形)について
- 前処理を行う理由が明記されているか(例えば、ディシジョンツリー作成のために離散化する必要がある、など)
- 前処理で行ったことを説明しているか
- データ分析のPythonプログラムについて(以下は1回だけでなく、なんども繰り返されることが望ましいです。レポートには時系列で記載されていればOKです。)
- データ分析の目的が示されているか(例えば、とりあえずよく分からないのでグラフ化してみる)
- プログラムの説明があるか
- 実行結果が示されているか
- (可能なら)結果から次の目的を立てて分析が繰り返されているか
- 考察(ここまでは自分が行った作業を記録したもの、この考察だけがその結果からの意見を言うところ)
- 分析から分かったこと、または分からなかったことが示されているか
- 今後にデータ分析を続ける場合、何に気を付け、何をすれば良いかが書かれているか
- できた/できない、ではなくてレポートにかけた時間で評価したいです
C言語とPythonの違い: 「3 4 5」と出力されるプログラムの場合
Pythonの場合
C++の場合