狠狠撸

狠狠撸Share a Scribd company logo
九州大学 大学院システム情報科学研究院
情報知能工学部門
データサイエンス実践特別講座
備瀬竜馬,Diego Thomas, 末廣 大貴
「DSことはじめ」
データサイエンスに必要なスキル
2
データ解析スキル
検定、クラスタリング、回帰、
主成分分析、???
概論一で学習
プログラミングスキル
解析のための具体的なデータ加工処理を
コンピュータに指示
データを集めて後、実際にこれらの分析を行うには?
概論二?演習一
で学習
Excel じゃダメ?
?「まずは Excel で見てみる」は大事
?データの集計,簡単な可視化
?Excel で完結するのであればそれでヨシ
?もっと高度な分析がしたい!
?統計分析,機械学習,
?エクセルじゃ開けない!
3
本日の講義内容
?データサイエンス技術のプログラム実践前の準備
?プログラムの基本的な内容を勉強する
?pythonのインストール
?コンピュータに命令する:コンソール上のコマンド
?コンピュータにまとめて命令:プログラムコード
?演習問題
4
プログラムの準備
Pythonのインストール
5
プログラムとは
?コンピュータに対する命令の記述
?命令は何語?
?C
?Java
?R
?Python
6
Python のインストール
7
https://docs.continuum.io/anaconda/install
以下の web site へ
Python のインストール
8
Windows の人
macの人
Python のインストール
9
64 bit
3.7 version
を使います
Python のインストール
10
たぶんいらない
Python のインストール
11
ダウンロードしたファイルを開く
12
Mac の人
13
Windows の人
Anaconda 1/3
?Anaconda Navigator を起動
14
こんなやつ
Anaconda 2/3
15
右(「わかった,二度と見せるな」)を押そう
左を押すと,起動するたびに現れます
Anaconda 3/3
16
とりあえずここをクリック
「Spyder」が起動します
Welcome to Python!
17
Welcome to Python!
18
ここだけは必ずチェック!
19
番号が違うと違う動作をする
コンピュータに指示を出す
Python で
あそんでみよう
まずはここに注目
(コンソールと呼ばれる部分)
21
狭いので
広げよう!
まずはここに注目
(コンソールと呼ばれる部分)
22
大事な「おまじない」
?今後,spyder を起動したらまずはじめに
必ずやること!
?import numpy as np
と打って enter キーを押す
23
コンピュータに指示を出す
文字の表示
お約束のHello World!
24
Hello World
? コンソールのところで
Print(“Hello World”) と入力
? return キーを押す(実行)
25
練習1:文字を変えてみよう!
? コンソールのところで
? 好きな言葉を“ ”に入れて表示させよう
Print(“ ”) と入力
? return キーを押す(実行)
26
コンピュータに指示を出す
四則演算
たす,ひく,かける,わる
27
足し算
?+
?例
28
引き算
? -
?例
29
掛け算
?* (アスタリスク)を使う
?例
30
割り算
?/ (スラッシュ)を使う
?例
31
括弧
?()内を優先的に計算
?(1-4)*5
32
練習2:四則演算
? 小学生の問題)
? A君が八百屋で100円のリンゴを5個と400円のイチゴを買いました。
? 合計にいくらになるかプログラムで計算させてみよう!
? 自分の BMI をプログラムで計算してみよう
ヒント:BMI は 体重 ÷ (身長×身長)
33
※体重は kg, 身長は m
変数
34
変数 (1)
?変数:お好きな数を保存する「箱」
?=を使って保存
(左側が「箱の名前」,右側がお好きな数)
?a=5
?b=“Monday” 実は文字列でも OK !
35
5 a
変数:演算 (2)
?変数同士の演算
?a=5
?b=3
36
5
a
3
b
a b ?
変数 :代入(2)
?変数同士の演算
?a=5, b=3
37
a b
5 3 a = b とすると、
a の中身を捨てて、
b の中身をa に入れる
変数 (3)
?変数の中身を変える
?a=5 a=20
?b=3 b=10
38
直接数字を書いて演算すると、毎回書き換える必要がある
変数で演算すると、同じ式でO.K.
変数 (4)
?データ1
a=5, b=4, c=1, d=6, e=29, f=12
(5+4)*(1+6)/29 + 12*5*4*(6-1)
?データ2
a=8, b=3, c=2, d=7, e=20, f=18
(8+3)*(2+7)/20 + 18*8*3*(7-2)
毎回すべて書き換える?
式で記述すれば、中身を変えるだけでO.K.
? (a+b)*(c+d)/e + f*a*b*(d-c)
39
プログラムの大きなメリット!
同じ命令文が違うデータに
使える
変数 (5):名前の付け方
?例:
name=“John”
age=30
weight=56
height=1.68
BMI=weight/(height*height)
print( name )
print( age )
print( weight )
print( height )
print( BMI )
40
箱の名前はわかるよう
につけよう!
変数 (6)
?良くない例:
a=“John”
b=30
c=56
d=1.68
?えっと BMI の計算式は???e=c/(d*d)
41
アドバイス:変数名はなんでもいいけど,
できる限り意味がわかりやすいように用意する
a name
練習3:変数
? 変数を使って、自分の BMI をプログラムで計算し
てみよう
ヒント:BMI は 体重 ÷ (身長×身長)
weight = 自分の体重
height = 自分の身長
42
※体重は kg, 身長は m
コンピュータに指示を出す
関数
43
「材料」と「道具」(1)
44
材料(変数) 道具(関数)
切る
皮をむく
煮る
print や
+や-も
道具の一種
関数(1)
45
例)
?平方根( )を計算する関数(道具)
?sqrt (平方根は、英語で’square root’でその略)
?道具を使うためのおまじない
?import math ライブラリ
道具はまとめて整理されている
調理する道具は台所、
トンカチ等の工具は工具箱
mathにsqrtがある
仕舞っている処から出して、
道具を使える状態にしている
関数(2)
46
?他にもいろいろなライブラリ、関数がある
? import numpy
? numpy.round(3.8)
? 小数点以下を四捨五入
? 毎回ライブラリ名をフルネームで書くのは面倒:短縮しちゃえ!
? import numpy as np
練習4:関数の利用
? 関数を使って計算しよう!
? 81の平方根を計算しよう
? 256の平方根を計算しよう
? 9.4を四捨五入しよう
? 9.7を四捨五入しよう
? 自分で関数をWebで調べて使ってみよう!
? 絶対値を求める関数を調べてみよう
? -5の絶対値を関数を使って計算しよう
47
ヒント)Python 絶対値
でGoogleで検索してみよう
基本注意事項
※知ってる人は遠慮なく飛ばしてください
全角文字,日本語入力を避ける
49
?日本語入力するとエラーが出る
a + b
全角スペース
全角文字,日本語入力を避ける(2)
?できる限り全角文字,日本語は使わない
?全角の空白(スペース)に注意!
(エラーになる&見つけづらい)
?ファイル名も半角英数字にしよう
OK:shincho_taiju.xlsx, height_weight.csv
NG:身長体重データ.csv
?半角カタカナ(???)とかもやめよう
50
コピー & ペースト(コピペ)
?手順1
?文章を選択(マウス,トラックパッド)
?右クリック → 「コピー」
?貼りつけたいところで右クリック→「ペースト」
?手順 2
?文章を選択(shift押したまま矢印キー)
?Ctrl+c (Windows), command+c (Mac)
?貼りつけたいところで
Ctrl+v (Windows), command+v(Mac)
51
カット & ペースト
?手順1
?文章を選択(マウス,トラックパッド)
?右クリック → 「カット」
?貼りつけたいところで右クリック→「ペースト」
?手順 2
?文章を選択(shift押したまま矢印キー)
?Ctrl+x (Windows), command+x (Mac)
?貼りつけたいところで
Ctrl+v (Windows), command+v(Mac)
52
プログラムにまとめて支持を出す
コードの書き方
一回一回命令するんじゃなくてまとめて
53
こんどはこっち(エディタ)
54
命令集を書く!
エディタの使い方(開く,保存)
55
① ファイルを開く
左:新しいファイル
右:既存のファイル (拡張子が .py のファイル)
② ファイルを保存する
リマインド:ファイル名は半角英数で!
エディタの使い方(実行)
56
③ 開いているファイルの命令文を全部実行
④ 選択している部分を実行
(マウスでもよいし,
shift 押しっぱなしで矢印キーでも翱碍)
エディタの使い方(実行)
③ 開いているファイルの命令文を全部実行
57
editor_ex.py を参照
エディタの使い方(実行)
④ 選択している部分を実行
58
実行したい部分を選択(青くなる)
コメントアウト
?メモ書き
?書いたけど一時的に実行したくない場合
?行頭に # で一行コメントアウト
?’’’ または “““ で囲んだ部分をコメントアウト
59
演習
60
演習1:BMI
?変数を使ってBMIを計算するコードを書いてみよう
ヒント:BMI は 体重 ÷ (身長×身長)
?変数の値を変えて、それぞれ計算してみよう
?A君:1.7m, 62kg
?B君:1.6m, 75kg
?C君:1.8m, 73kg
61
※体重は kg, 身長は m
演習2:関数の呼び出し
?求めたBMIを四捨五入してみよう
? ヒント:round
?求めたBMIを切り捨ててみよう
? ヒント:「python 切り捨て」でGoogleで検索
?求めたBMIを切り上げてみよう
?変数の値を変えて、それぞれ計算してみよう
?A君:1.7m, 62kg
?B君:1.6m, 75kg
?C君:1.8m, 73kg
62
演習3:関数の呼び出し
演習2のコードをエディタに書いてまとめて実行してみよう!
?求めたBMIを四捨五入してみよう
? ヒント:round
?求めたBMIを切り捨ててみよう
? ヒント:「python 切り捨て」でGoogleで検索
?求めたBMIを切り上げてみよう
?変数の値を変えて、それぞれ計算してみよう
?A君:1.7m, 62kg
?B君:1.6m, 75kg
?C君:1.8m, 73kg
63
演習:進みが早い人用
64
演習4:print文の応用
?変数aに5を代入して、
?print文で「aの中身は5です。」と表示してみよう。
?ヒント)「print format python」で検索
65
演習5:print文の応用
?演習3で作成したエディタファイルに以下のprint文
を追加してまとめて実行してみよう。
?「A君のBMIはxxxです。」と表示
?「B君のBMIはxxxです。」と表示
?「C君のBMIはxxxです。」と表示
?※)xxxの部分はそれぞれ計算したBMIが入る
66

More Related Content

データサイエンスことはじめ