5. 5
5
Preliminary Data Assessment
Sample data: 1990x.txt
90,000+ records (犖犖迦 records 犖÷元 new line characters = 2
lines)
Data elements: 犢犖ム犖犖犖萎犖迦犖園硯犖犖犖萎犖迦犖 犖犖劇犖 犖犖迦検犖犖犖伍献 犖犖朽犖犖∇弦犢
犖犖÷顕犖∇犖ム犢犖犖犖犖園犖犢 (犖犖迦 elements 犖÷元 data masking)
All records: birthYear==1990 && address==
犖犖犖伍犢犖犖犖÷見犖迦犖犖
https://breached.vc/ (Now Taken Down)
6. 6
6
Preliminary Data Assessment
犖犖迦 record 犖÷元犖犖朽犖犖∇弦犢犖犖朽犖÷元犖犢犖迦犢犖ム犖犖朽 犖犖迦 record 犖÷元犖犢犖犖÷弦犖ム牽犖萎犖園犖犖迦犖ム犖謹犖犢犖 犖犖犖劇賢
犖犖迦犖犖犖犖謹犖犢犖 犢犖犖犖犖о犖迦犢犖犖÷弦犖ム犖÷ clean 犖犢犖迦犖萎検犖朽犖犖萎犖犢犖犖犢犖迦犖犖伍犖犖迦犖犖犖犖犢犖犖÷弦犖
(data quality) 犖犖迦犖÷元犖犖朽犖÷顕犖犖迦犖犖ム顕犖∇犖犖ム犖 犢犖ム鍵犖犖迦犖÷元犖犢犖犖÷弦犖ム犖朽犢犖÷犖犖項犖犢犖犖犖犖萎犖
犖犖∇弦犢犢犖犢 (data accuracy issues)
犖÷元犖犖÷顕犖∇犖ム犢犖犖犖犖園犖犢犢犖犢犖犖ム sample data 犖犖謹犖犖迦犢犖÷犢犖犢犖犢犖犖÷弦犖ム犖迦犖犖萎犖犖犖萎犖犖朽権犖
犖犖迦県犖犖犢犖犖∇犖犖犢犖犖朽権犖犖犖∇犖迦犢犖犖朽権犖
犖犖迦 record 犢犖 sample data 犖犖萎犖項犖犖園犢犖犢犖 2 犖犖犖犖犖園 犢犖犢犖迦犖朽犖犖о顕犖犖犖迦犖 犖÷険犖犖犖
犢犖犢犖 record 犖犖朽犢犖÷犖÷元犖犖÷顕犖∇犖ム犢犖犖犖犖園犖犢 犖犖迦犖犢犖犖迦牽犖犖犖犖巌 (mask) 犖犖÷顕犖∇犖ム
犢犖犖犖犖園犖犢犖犢犖о権 XXXXXX- 犖犖項犖犖園犢犖犢犖犖犖犖犖犖園犖犢犖犢犖 犖犖謹犖犖犖迦犢犖犢犖犖犢犖犖犖巌犖犖ム顕犖
(bug) 犖犖犖犖犖犖萎犖о犖犖迦牽 transform data 犖犖犖犖犖項犖犖犖萎犖迦犖巌犢犖犖 犢犖犢犖犢犖犢犖犢犖о犖迦犖犖
犢犖犖朽権犖 code 犢犖犖劇犖 mask data 犖犖迦 handle logic 犖犖犖犖朽犖÷犖÷元犖犖÷顕犖∇犖ム犢犖犖犖犖園犖犢
犖犖巌犖犖ム顕犖 犖犖迦犖犢 XXXXXX- 犖犖項 add 犖犖ム険犖犖犖園犖犖犖 new line character
犢犖犖犖犖朽犖犖萎犖項 add 犖犢犖犖犖犖園犖犖犖 new line character 犖犖園犖犖ム犖迦硯 犖犖謹犖犖犖萎犢犖犖犖о犖
犖犖項犖犖犖萎犖迦犖巌犖犖迦犢犖÷犢犖犢犖÷厳犖犖犖迦犖朽犖犖園犖犖犖劇賢犖犖迦犢犖÷犢犖犢犖÷元犖犖о顕犖÷献犖萎犖犖朽権犖犖犖犖犖犖犖犢犖犢犖÷犖朽
https://breached.vc/ (Now Taken Down)