ݺߣ

ݺߣShare a Scribd company logo
Jedna cifra vl´adne vˇsem
Jiˇr´ı Haviger
FIM UHK - matematika, statistika, zpracov´an´ı dat
BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
13. listopadu 2019
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
Platonsk´y svˇet matematiky
platonsk´y dokonal´y svˇet = matematika
vˇety, odvozen´ı a d˚ukazy,
matematick´a odvozen´ı ˇcist´a,
bez nutnosti ovˇeˇren´ı v re´aln´em svˇetˇe
jednoznaˇcnˇe definovan´e funkce
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
Aplikovan´a matematika
re´aln´y svˇet = nedokonalost, nepˇresnosti, chyby, odchylky
aplikovan´a matematika = ...
... snaha popsat nedokonal´y svˇet dokonalou matematiku
... snaha vysvˇetlit re´aln´a pozorov´an´ı matematick´ym modelem
... ˇcasto vych´az´ı z dat, matematick´y model je hled´an na z´akladˇe
pozorov´an´ı
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
Vstupn´ı znalosti
mocnina
logaritmus
cel´a ˇc´ast ˇc´ısla (rounddown, floor, x )
posloupnost aritmetick´a, geometrick´a, fibonacciho
z´aklady pr´ace v excelu
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
Funkce prvn´ı cifry
Jak z´ıskat z ˇc´ısla prvn´ı cifru?
pˇr´ıklad: x = 7568
logaritmujeme log x = 3, 87898...
pot´e cel´a ˇc´ast log x = 3
umocn´ıme 10 log x
= 103
= 1000
vydˇel´ıme x
10 log x = 7, 568
vezmeme celou ˇc´ast x
10 log x = 7
lze definovat novou funkci first-digit fd(x) = x
10 log x
graf v desmos
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
Implementace v excelu, resp v python
implementace v excelu pro x > 0
CEL´A.ˇC´AST(x/10∧(CEL´A.ˇC´AST(LOG(x))))
CEL´A.ˇC´AST(x/POWER(10;(CEL´A.ˇC´AST(LOG(x))))
implementace v python pro x > 0
import math
fd = math.floor(x/(pow(10,math.floor(math.log10(x)))))
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
ˇCetnost prvn´ıch cifer v datech
poˇcet obyvatel mˇest ˇcesk´e republiky (data 2018)
tipnˇete, jestli je v´ıce tˇech, kter´a zaˇc´ınaj´ı 1..4 nebo 5..9
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
ˇCetnost prvn´ıch cifer v datech
poˇcet obyvatel mˇest ˇcesk´e republiky (data 2018)
tipnˇete, jestli je v´ıce tˇech, kter´a zaˇc´ınaj´ı 1..4 nebo 5..9
poˇcet vˇeˇr´ıc´ıch svˇetov´ych n´aboˇzenstv´ı
grafy z webu testingbenfordslaw
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
ˇCetnost prvn´ıch cifer v datech
poˇcet obyvatel mˇest ˇcesk´e republiky (data 2018)
tipnˇete, jestli je v´ıce tˇech, kter´a zaˇc´ınaj´ı 1..4 nebo 5..9
poˇcet vˇeˇr´ıc´ıch svˇetov´ych n´aboˇzenstv´ı
grafy z webu testingbenfordslaw
nˇekter´a data vykazuj´ı v prvn´ı cifˇre dominantn´ı jedniˇcku
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
ˇCetnost prvn´ıch cifer v datech
z´avˇer z uk´azkov´ych dat
nˇekter´a data vykazuj´ı dominantn´ı jedniˇcku
ostatn´ı cifry maj´ı klesaj´ıc´ı tendenci
Proˇc tomu tak je? Nutno zkoumat ...
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
ˇCetnost prvn´ıch cifer v datech
z´avˇer z uk´azkov´ych dat
nˇekter´a data vykazuj´ı dominantn´ı jedniˇcku
ostatn´ı cifry maj´ı klesaj´ıc´ı tendenci
Proˇc tomu tak je? Nutno zkoumat ...
... pro kter´a data to plat´ı a pro kter´a ne
... ˇc´ım jsou ty pro kter´e to plat´ı odliˇsn´e?
... existuje smyslupln´a funkce popisuj´ıc´ı ˇcetnost jednotliv´ych cifer?
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
ˇCetnost prvn´ıch cifer v posloupnostech
Anal´yza dobˇre zn´am´ych dat poprv´e:
posloupnost aritmetick´a
posloupnost geometrick´a
posloupnost Fibonacciho
posloupnost druh´ych mocnin
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
ˇCetnost prvn´ıch cifer v posloupnostech
Anal´yza dobˇre zn´am´ych dat poprv´e:
posloupnost aritmetick´a
posloupnost geometrick´a
posloupnost Fibonacciho
posloupnost druh´ych mocnin
dominantn´ı jedniˇcku vykazuj´ı geometrick´a, fibonacciho posloupnost
a druh´e mocniny
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
ˇCetnost prvn´ıch cifer v n´ahodn´ych ˇc´ıslech
Anal´yza dobˇre zn´am´ych dat podruh´e:
h´azen´ı kostkou
aritmetika
sˇc´ıt´an´ı v´ysledk˚u, n´asoben´ı v´ysledk˚u, dˇelen´ı v´ysledk˚u
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
ˇCetnost prvn´ıch cifer v n´ahodn´ych ˇc´ıslech
Anal´yza dobˇre zn´am´ych dat podruh´e:
h´azen´ı kostkou
aritmetika
sˇc´ıt´an´ı v´ysledk˚u, n´asoben´ı v´ysledk˚u, dˇelen´ı v´ysledk˚u
dominantn´ı jedniˇcku nalezneme pˇri n´asoben´ı a dˇelen´ı
rovnomˇern´ych v´ysledk˚u
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
Aritmetika prvn´ıch cifer z mˇest
Anal´yza aritmetiky dat ve kter´e jedniˇcka dominuje:
n´asoben´ı ˇc´ıslem nemˇen´ı frekvenci prvn´ı cifry,
n´asoben´ı ˇc´ıslem nemˇen´ı poˇcet dat, ale mˇen´ı rozsah dat,
tedy pˇri zmˇenˇe rozsahu (n´asoben´ım) se nemˇen´ı frekvence prvn´ı cifry
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
Ot´azka pro publikum
pro x = 1..9 urˇcete, kolik procent hodnoty ˇc´ısla x mus´ıme pˇridat,
abychom se dostali k ˇc´ıslu x + 1?
napˇr 5 → 6 mus´ıme pˇridat 6−5
5 , tedy 5
+20%
−−−→ 6
Z´avis´ı tento posun na desetin´asobku x?
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
Ot´azka pro publikum
pro x = 1..9 urˇcete, kolik procent hodnoty ˇc´ısla x mus´ıme pˇridat,
abychom se dostali k ˇc´ıslu x + 1?
napˇr 5 → 6 mus´ıme pˇridat 6−5
5 , tedy 5
+20%
−−−→ 6
Z´avis´ı tento posun na desetin´asobku x?
1
+100%
−−−−→ 2
+50%
−−−→ 3
+33%
−−−→ 4
+25%
−−−→ 5
+20%
−−−→ 6
+17%
−−−→ 7
+14%
−−−→ 8
+13%
−−−→ 9
+11%
−−−→ 10
10
+100%
−−−−→ 20
+50%
−−−→ 30
+33%
−−−→ . . .
100
+100%
−−−−→ 200
+50%
−−−→ 300
+33%
−−−→ . . .
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
... koneˇcnˇe matematika
Hled´ame tedy funkci, pro kterou
1/ f (1..2) = f (2) − f (1) ...
2/ a z´aroveˇn
f (1..2) = f (2..4) = · · · = f (10..20) = f (100..200) = . . .
tedy f (x) − f (y) = f (c · x) − f (y · y),
resp. f (x) − f (c · x) = f (y) − f (c · y)
tedy rozd´ıl f (x) − f (c · x) z´avis´ı pouze na konstantˇe c a nikoli na x
matematik se zamysl´ı ...
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
... koneˇcnˇe matematika
... a zjist´ı, ˇze pro funkci f : y = log(x) plat´ı
log(100) − log(10) = log(1000) − log(100)
a tak´e plat´ı log(x) − log(c · x) = log x
c·x = log 1
c
takˇze hledan´a funkce m´a vyj´adˇren´ı
f (x) = log(x + 1) − log(x) = log
x + 1
x
= log 1 +
1
x
d´ıky ˇsk´alov´an´ı staˇc´ı zkoumat rozloˇzen´ı mezi 1..9 tedy, vzd´alenosti
hodnot log(1), log(2), . . .
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
... koneˇcnˇe matematika
... a zjist´ı, ˇze pro funkci f : y = log(x) plat´ı
log(100) − log(10) = log(1000) − log(100)
a tak´e plat´ı log(x) − log(c · x) = log x
c·x = log 1
c
takˇze hledan´a funkce m´a vyj´adˇren´ı
f (x) = log(x + 1) − log(x) = log
x + 1
x
= log 1 +
1
x
d´ıky ˇsk´alov´an´ı staˇc´ı zkoumat rozloˇzen´ı mezi 1..9 tedy, vzd´alenosti
hodnot log(1), log(2), . . .
naˇse hypot´eza: pravdˇepodobnost v´yskytu cifry x je
P(x) = log
x + 1
x
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
Ovˇeˇren´ı
m´ame matematick´y model popisuj´ıc´ı v´yskyt prvn´ıch cifer v nˇekter´ych
datech P(x) = log x+1
x . Zb´yv´a ...
... ovˇeˇrit nakolik se hypotetick´e hodnoty shoduj´ı s namˇeˇren´ymi
hodnotami, tedy vyˇc´ıslit odchylky od modelu
... urˇcit, zda se jedn´a o n´ahodn´e odchylky nebo bias
... zjistit zda model popisuje obecnou z´akonitost nebo ”jen”naˇse data
... nast´ınit na kter´ych datech lze oˇcek´avat ”dominantn´ı jedniˇcku”
... publikovat v´ysledek, aby n´am jen ”neleˇzel v ˇsupl´ıku”
to vˇse viz kurzy zpracov´an´ı dat na vˇetˇsinˇe VˇS
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
Benford’s law a jeho vlastnosti
Benford˚uv z´akon (Newcomb–Benford’s law)
popisuje pravdˇepodobnost v´yskytu cifry x : P(x) = log x+1
x
je to z´akon popsan´y ide´aln´ı matematikou
nemˇen´ı se pˇri n´asoben´ı, dˇelen´ı, zmˇenˇe ˇc´ıseln´e soustavy
v re´aln´ych situac´ıch plat´ı pˇribliˇznˇe
plat´ı jen pro nˇekter´a data a pro jin´a ne
m´a praktick´e aplikace napˇr. pˇri detekci podvod˚u
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
Z´avˇer
Jedna cifra vl´adne vˇsem ...
Jiˇr´ı Haviger
DOI prezentace pro pˇr´ıpadn´e citace:
10.13140/RG.2.2.26296.90886
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem
Inspirace
http://testingbenfordslaw.com
wiki - Benford’s law
youtube - Singingbanana - Benford’s Law - How mathematics can
detect fraud!
youtube - Numberphile - Number 1 and Benford’s Law
Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı
Jedna cifra vl´adne vˇsem

More Related Content

První cifra vládne všem

  • 1. Jedna cifra vl´adne vˇsem Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı 13. listopadu 2019 Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 2. Platonsk´y svˇet matematiky platonsk´y dokonal´y svˇet = matematika vˇety, odvozen´ı a d˚ukazy, matematick´a odvozen´ı ˇcist´a, bez nutnosti ovˇeˇren´ı v re´aln´em svˇetˇe jednoznaˇcnˇe definovan´e funkce Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 3. Aplikovan´a matematika re´aln´y svˇet = nedokonalost, nepˇresnosti, chyby, odchylky aplikovan´a matematika = ... ... snaha popsat nedokonal´y svˇet dokonalou matematiku ... snaha vysvˇetlit re´aln´a pozorov´an´ı matematick´ym modelem ... ˇcasto vych´az´ı z dat, matematick´y model je hled´an na z´akladˇe pozorov´an´ı Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 4. Vstupn´ı znalosti mocnina logaritmus cel´a ˇc´ast ˇc´ısla (rounddown, floor, x ) posloupnost aritmetick´a, geometrick´a, fibonacciho z´aklady pr´ace v excelu Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 5. Funkce prvn´ı cifry Jak z´ıskat z ˇc´ısla prvn´ı cifru? pˇr´ıklad: x = 7568 logaritmujeme log x = 3, 87898... pot´e cel´a ˇc´ast log x = 3 umocn´ıme 10 log x = 103 = 1000 vydˇel´ıme x 10 log x = 7, 568 vezmeme celou ˇc´ast x 10 log x = 7 lze definovat novou funkci first-digit fd(x) = x 10 log x graf v desmos Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 6. Implementace v excelu, resp v python implementace v excelu pro x > 0 CEL´A.ˇC´AST(x/10∧(CEL´A.ˇC´AST(LOG(x)))) CEL´A.ˇC´AST(x/POWER(10;(CEL´A.ˇC´AST(LOG(x)))) implementace v python pro x > 0 import math fd = math.floor(x/(pow(10,math.floor(math.log10(x))))) Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 7. ˇCetnost prvn´ıch cifer v datech poˇcet obyvatel mˇest ˇcesk´e republiky (data 2018) tipnˇete, jestli je v´ıce tˇech, kter´a zaˇc´ınaj´ı 1..4 nebo 5..9 Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 8. ˇCetnost prvn´ıch cifer v datech poˇcet obyvatel mˇest ˇcesk´e republiky (data 2018) tipnˇete, jestli je v´ıce tˇech, kter´a zaˇc´ınaj´ı 1..4 nebo 5..9 poˇcet vˇeˇr´ıc´ıch svˇetov´ych n´aboˇzenstv´ı grafy z webu testingbenfordslaw Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 9. ˇCetnost prvn´ıch cifer v datech poˇcet obyvatel mˇest ˇcesk´e republiky (data 2018) tipnˇete, jestli je v´ıce tˇech, kter´a zaˇc´ınaj´ı 1..4 nebo 5..9 poˇcet vˇeˇr´ıc´ıch svˇetov´ych n´aboˇzenstv´ı grafy z webu testingbenfordslaw nˇekter´a data vykazuj´ı v prvn´ı cifˇre dominantn´ı jedniˇcku Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 10. ˇCetnost prvn´ıch cifer v datech z´avˇer z uk´azkov´ych dat nˇekter´a data vykazuj´ı dominantn´ı jedniˇcku ostatn´ı cifry maj´ı klesaj´ıc´ı tendenci Proˇc tomu tak je? Nutno zkoumat ... Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 11. ˇCetnost prvn´ıch cifer v datech z´avˇer z uk´azkov´ych dat nˇekter´a data vykazuj´ı dominantn´ı jedniˇcku ostatn´ı cifry maj´ı klesaj´ıc´ı tendenci Proˇc tomu tak je? Nutno zkoumat ... ... pro kter´a data to plat´ı a pro kter´a ne ... ˇc´ım jsou ty pro kter´e to plat´ı odliˇsn´e? ... existuje smyslupln´a funkce popisuj´ıc´ı ˇcetnost jednotliv´ych cifer? Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 12. ˇCetnost prvn´ıch cifer v posloupnostech Anal´yza dobˇre zn´am´ych dat poprv´e: posloupnost aritmetick´a posloupnost geometrick´a posloupnost Fibonacciho posloupnost druh´ych mocnin Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 13. ˇCetnost prvn´ıch cifer v posloupnostech Anal´yza dobˇre zn´am´ych dat poprv´e: posloupnost aritmetick´a posloupnost geometrick´a posloupnost Fibonacciho posloupnost druh´ych mocnin dominantn´ı jedniˇcku vykazuj´ı geometrick´a, fibonacciho posloupnost a druh´e mocniny Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 14. ˇCetnost prvn´ıch cifer v n´ahodn´ych ˇc´ıslech Anal´yza dobˇre zn´am´ych dat podruh´e: h´azen´ı kostkou aritmetika sˇc´ıt´an´ı v´ysledk˚u, n´asoben´ı v´ysledk˚u, dˇelen´ı v´ysledk˚u Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 15. ˇCetnost prvn´ıch cifer v n´ahodn´ych ˇc´ıslech Anal´yza dobˇre zn´am´ych dat podruh´e: h´azen´ı kostkou aritmetika sˇc´ıt´an´ı v´ysledk˚u, n´asoben´ı v´ysledk˚u, dˇelen´ı v´ysledk˚u dominantn´ı jedniˇcku nalezneme pˇri n´asoben´ı a dˇelen´ı rovnomˇern´ych v´ysledk˚u Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 16. Aritmetika prvn´ıch cifer z mˇest Anal´yza aritmetiky dat ve kter´e jedniˇcka dominuje: n´asoben´ı ˇc´ıslem nemˇen´ı frekvenci prvn´ı cifry, n´asoben´ı ˇc´ıslem nemˇen´ı poˇcet dat, ale mˇen´ı rozsah dat, tedy pˇri zmˇenˇe rozsahu (n´asoben´ım) se nemˇen´ı frekvence prvn´ı cifry Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 17. Ot´azka pro publikum pro x = 1..9 urˇcete, kolik procent hodnoty ˇc´ısla x mus´ıme pˇridat, abychom se dostali k ˇc´ıslu x + 1? napˇr 5 → 6 mus´ıme pˇridat 6−5 5 , tedy 5 +20% −−−→ 6 Z´avis´ı tento posun na desetin´asobku x? Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 18. Ot´azka pro publikum pro x = 1..9 urˇcete, kolik procent hodnoty ˇc´ısla x mus´ıme pˇridat, abychom se dostali k ˇc´ıslu x + 1? napˇr 5 → 6 mus´ıme pˇridat 6−5 5 , tedy 5 +20% −−−→ 6 Z´avis´ı tento posun na desetin´asobku x? 1 +100% −−−−→ 2 +50% −−−→ 3 +33% −−−→ 4 +25% −−−→ 5 +20% −−−→ 6 +17% −−−→ 7 +14% −−−→ 8 +13% −−−→ 9 +11% −−−→ 10 10 +100% −−−−→ 20 +50% −−−→ 30 +33% −−−→ . . . 100 +100% −−−−→ 200 +50% −−−→ 300 +33% −−−→ . . . Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 19. ... koneˇcnˇe matematika Hled´ame tedy funkci, pro kterou 1/ f (1..2) = f (2) − f (1) ... 2/ a z´aroveˇn f (1..2) = f (2..4) = · · · = f (10..20) = f (100..200) = . . . tedy f (x) − f (y) = f (c · x) − f (y · y), resp. f (x) − f (c · x) = f (y) − f (c · y) tedy rozd´ıl f (x) − f (c · x) z´avis´ı pouze na konstantˇe c a nikoli na x matematik se zamysl´ı ... Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 20. ... koneˇcnˇe matematika ... a zjist´ı, ˇze pro funkci f : y = log(x) plat´ı log(100) − log(10) = log(1000) − log(100) a tak´e plat´ı log(x) − log(c · x) = log x c·x = log 1 c takˇze hledan´a funkce m´a vyj´adˇren´ı f (x) = log(x + 1) − log(x) = log x + 1 x = log 1 + 1 x d´ıky ˇsk´alov´an´ı staˇc´ı zkoumat rozloˇzen´ı mezi 1..9 tedy, vzd´alenosti hodnot log(1), log(2), . . . Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 21. ... koneˇcnˇe matematika ... a zjist´ı, ˇze pro funkci f : y = log(x) plat´ı log(100) − log(10) = log(1000) − log(100) a tak´e plat´ı log(x) − log(c · x) = log x c·x = log 1 c takˇze hledan´a funkce m´a vyj´adˇren´ı f (x) = log(x + 1) − log(x) = log x + 1 x = log 1 + 1 x d´ıky ˇsk´alov´an´ı staˇc´ı zkoumat rozloˇzen´ı mezi 1..9 tedy, vzd´alenosti hodnot log(1), log(2), . . . naˇse hypot´eza: pravdˇepodobnost v´yskytu cifry x je P(x) = log x + 1 x Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 22. Ovˇeˇren´ı m´ame matematick´y model popisuj´ıc´ı v´yskyt prvn´ıch cifer v nˇekter´ych datech P(x) = log x+1 x . Zb´yv´a ... ... ovˇeˇrit nakolik se hypotetick´e hodnoty shoduj´ı s namˇeˇren´ymi hodnotami, tedy vyˇc´ıslit odchylky od modelu ... urˇcit, zda se jedn´a o n´ahodn´e odchylky nebo bias ... zjistit zda model popisuje obecnou z´akonitost nebo ”jen”naˇse data ... nast´ınit na kter´ych datech lze oˇcek´avat ”dominantn´ı jedniˇcku” ... publikovat v´ysledek, aby n´am jen ”neleˇzel v ˇsupl´ıku” to vˇse viz kurzy zpracov´an´ı dat na vˇetˇsinˇe VˇS Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 23. Benford’s law a jeho vlastnosti Benford˚uv z´akon (Newcomb–Benford’s law) popisuje pravdˇepodobnost v´yskytu cifry x : P(x) = log x+1 x je to z´akon popsan´y ide´aln´ı matematikou nemˇen´ı se pˇri n´asoben´ı, dˇelen´ı, zmˇenˇe ˇc´ıseln´e soustavy v re´aln´ych situac´ıch plat´ı pˇribliˇznˇe plat´ı jen pro nˇekter´a data a pro jin´a ne m´a praktick´e aplikace napˇr. pˇri detekci podvod˚u Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 24. Z´avˇer Jedna cifra vl´adne vˇsem ... Jiˇr´ı Haviger DOI prezentace pro pˇr´ıpadn´e citace: 10.13140/RG.2.2.26296.90886 Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem
  • 25. Inspirace http://testingbenfordslaw.com wiki - Benford’s law youtube - Singingbanana - Benford’s Law - How mathematics can detect fraud! youtube - Numberphile - Number 1 and Benford’s Law Jiˇr´ı Haviger FIM UHK - matematika, statistika, zpracov´an´ı dat BiGy - deskriptivn´ı geometrie a 3D modelov´an´ı Jedna cifra vl´adne vˇsem