�ݺ�ߣ

WhyFeatureScaling
Required
Copyright © Cognitior www.cognitior.com

State Age Salary Purchase
California 21 21000 No
Texas 25 25000 No
Arizona 23 25000 Yes
Utah 33 30000 Yes
California 45 35000 Yes
Texas 26 27000 Yes
Arizona 27 29000 No
Texas 30 32000 No
Texas 32 31000 Yes
Utah 33 35000 Yes
Utah 34 40000 Yes
Texas 36 42000 Yes
Texas 34 35000 No
Whyfeaturescalingisrequired?
Age
Salary
(𝑋1, 𝑌1)
(𝑋2, 𝑌2)
Euclidean Distance = (𝑋2 − 𝑋1)2+(𝑌2 − 𝑌1)2
Euclidean Distance = (45 − 21)2+(35000 − 21000)2
Euclidean Distance = 576 + 196000000
Euclidean Distance = 14000

• K-Nearest Neighbour
• K-Means
Whyfeaturescalingisrequired?
• Principal Component Analysis (PCA)

Howcanweimplementfeaturescaling?
• Standardization
• Normalization
𝑿 𝒏𝒆𝒘 =
𝑿𝒊 − 𝑿 𝒎𝒊𝒏
𝑿 𝒎𝒂𝒙 − 𝑿 𝒎𝒊𝒏
𝑿 𝒏𝒆𝒘 =
𝑿𝒊 − 𝑿 𝒎𝒆𝒂𝒏
𝝈 𝑿

Texas 25 25000 No
Utah 33 30000 Yes
Texas 26 27000 Yes
Arizona 27 29000 No
Texas 30 32000 No
Texas 32 31000 Yes
Utah 33 35000 Yes
Utah 34 40000 Yes
Texas 36 42000 Yes
Texas 34 35000 No
Standardization
𝑿 𝒏𝒆𝒘 =
𝑿𝒊 − 𝑿 𝒎𝒆𝒂𝒏
𝝈 𝑿
𝑿 𝒎𝒆𝒂𝒏 (𝑨𝒈𝒆) = 𝟑𝟎. 𝟐𝟗
𝝈 𝒙 (𝑨𝒈𝒆) = 𝟔. 𝟎𝟗
STD Age
-1.53
-0.87
-1.2
0.45
2.42
-0.87
-0.7
-0.54
-0.05
0.28
0.45
0.61
0.94
0.61
STD Salary
-1.61
-0.95
-0.95
-0.12
0.71
-1.28
-0.62
-0.28
0.21
0.05
0.71
1.54
1.88
0.71
𝑿 𝒎𝒆𝒂𝒏 (𝑺𝒂𝒍𝒂𝒓𝒚) = 𝟑𝟎𝟕𝟏𝟒. 𝟐𝟗
𝝈 𝒙 (𝑺𝒂𝒍𝒂𝒓𝒚) = 𝟔𝟎𝟏𝟔. 𝟗𝟖

Texas 25 25000 No
Utah 33 30000 Yes
Texas 26 27000 Yes
Arizona 27 29000 No
Texas 30 32000 No
Texas 32 31000 Yes
Utah 33 35000 Yes
Utah 34 40000 Yes
Texas 36 42000 Yes
Texas 34 35000 No
Normalization
𝑿 𝒎𝒊𝒏(𝑨𝒈𝒆) = 𝟐𝟏
𝑿 𝒎𝒂𝒙(𝑨𝒈𝒆) = 𝟒𝟓
STD Age
0
0.17
0.08
0.5
1
0.17
0.21
0.25
0.38
0.46
0.5
0.54
0.63
0.54
STD Salary
0.00
0.19
0.19
0.43
0.67
0.10
0.29
0.38
0.52
0.48
0.67
0.90
1.00
0.67
𝑿 𝒎𝒊𝒏(𝑺𝒂𝒍𝒂𝒓𝒚) = 𝟐𝟏𝟎𝟎𝟎
𝑿 𝒎𝒂𝒙(𝑺𝒂𝒍𝒂𝒓𝒚) = 𝟒𝟐𝟎𝟎𝟎
𝑿 𝒏𝒆𝒘 =
𝑿𝒊 − 𝑿 𝒎𝒊𝒏
𝑿 𝒎𝒂𝒙 − 𝑿 𝒎𝒊𝒏

ThankYou!!!
AnyQuestions?
support@cognitior.com

�ݺ�ߣ

Feature scaling

More Related Content

Feature scaling

Editor's Notes