端端舝

OCaml及失本件皮仿毛
掂戈�
菴媼隙紼郭辭ッ頗
@no_maddo

歹凶仄反掞
? 奶件正奈生永玄及�@no_maddo
? 戊件由奶仿互湮疑五
? 戊件由奶仿匹戊件由奶仿互妘尹月

云仇午歹曰
奶市
㜭仄中匹允
紹及俴

失斥尼件母
? OCaml及苂仁x86失本件皮仿毛掂氏匹﹜
戊件由奶仿及𠸎厥切卞卅月匹允方
每 64bit及仇午仄井𠸎卞仄卅中伉永民玄奈弁
每磐�丐曰引六氏
每 OCaml 4.05.0, -O3, -unsafe匹戊件由奶伙
每 �砓ㄩ場陑氪砃仃
? 戊件由奶仿場陑氪
? 午卞井仁失本件皮仿互掂心凶中穴件
? 癶籵及�仄井仄引六氏

OCaml互苂仁失本件皮仿及蛁砩
? ㄠ白央奶伙匹ㄠ勾及乒斥亙奈伙毛桶允
每乒斥亙奈伙毛釬月凶戶及灍俴戊奈玉互釬日木月
? 乒斥亙奈伙靡匹suffix﹜失伙白央劐𡥼今木化月
每卅兮分井歹井曰引允友ˋ

淕杅栳呾
let add1 x = x + 1 addq $2, %rax
ret
let add2 x = x + 2 addq $4, %rax
ret

tag bit
? GC及凶戶卞�卞tag毛葆仃化中月
每 int卅日郔狟弇bit互都卞1
每 pointer卅日都卞0
? Major GC匹反Mark and Sweep毛支月凶戶
? 64bit及Int互幻仄中午五反Int64互丐月
每 alloc今木凶瓜穴及64bit int......
https://realworldocaml.org/v1/en/html/memory-representation-of-values.html

float倰 1
let fadd1 x = x +. 1.0
subq $8, %rsp
.L100:
movq %rax, %rbx
.L101:
subq $16, %r15
movq caml_young_limit@GOTPCREL(%rip), %rax
cmpq (%rax), %r15
jb .L102
leaq 8(%r15), %rax
movq $1277, -8(%rax)
movsd .L104(%rip), %xmm0
addsd (%rbx), %xmm0
movsd %xmm0, (%rax)
addq $8, %rsp
.L102:
call caml_call_gc@PLT
.L103:
jmp .L101

卅兮禾奶件正
? 疶�ㄩfloat -> float卅日竘杅毛unboxed匹午勻
化手謎中及匹反ˋˋˋ
? 詢蕆憝杅午及潭友磁中匹ㄠ伐奈玉卞𠐓勻化卅
仃木壬卅日卅中ㄗboxed, uniform)
每詢蕆憝杅囀匹網太堤仄仄凶午五卞妏丹伊斥旦正

float倰 2
let fadd1_arr a x =
a.(0) <- x +. 1.0
addsd (%rbx), %xmm0
movsd %xmm0, (%rax)
movq $1, %rax
ret
alloc互祥斛猁卅�磁卞反復悵仄卅中
↗ -unsafe勾五匹戊件由奶伙

珨筒引午戶
? 淕杅午禾奶件正毛Е�e允月正弘互丐月
每 GC午及潭友磁中
? float倰及�反憝杅毛磊蚕允月午五卞
丟乒伉復悵今木月
每嗣眈憝杅午及潭友磁中

for宒午array
? OCaml及for宒反fortran心凶中
每 for i = e1 to e2 do e3 done
每伙奈皿及⻌曰諳匹隙�杅互復隅允月ㄐ
? 仇及丐凶曰郔羥趙互ʃ中

for宒 1
let itof = float_of_int
let f a b =
for i = 0 to 100 do
a.(i) <- b.(i) +. itof i
done
.L102:
movq $1, %rdi
cmpq $201, %rdi
jg .L100
.L101:
movq %rdi, %rsi
sarq $1, %rsi
cvtsi2sdq %rsi, %xmm0
addsd -4(%rbx,%rdi,4), %xmm0
movsd %xmm0, -4(%rax,%rdi,4)
movq %rdi, %rsi
addq $2, %rdi
cmpq $201, %rsi
jne .L101
.L100:
movq $1, %rax
ret
剠鎣
0毛本永玄
衵扑白玄
正弘毛俋允

忒匹郔羥趙
.L102:
movq $0, %rdi
.L101:
cvtsi2sdq %rdi, %xmm0
addsd 0(%rbx,%rdi,4), %xmm0
movsd %xmm0, 0(%rax,%rdi,4)
addq $1, %rdi
cmpq $100, %rsi
jne .L101
.L100:
movq $1, %rax
ret
.L102:
movq $1, %rdi
cmpq $201, %rdi
jg .L100
.L101:
movq %rdi, %rsi
sarq $1, %rsi
movq %rdi, %rsi
addq $2, %rdi
cmpq $201, %rsi
jne .L101
.L100:
movq $1, %rax
ret
?caml int -> raw int及郔羥趙
?祥猁煦嶊及祅壺

切卅心卞gcc 每O2
void f (double a[],
double b[]) {
for (int i = 0; i < 100; i++)
a[i] = b[i] + (double) i;
}
f:
.LFB0:
xorl %eax, %eax
.L2:
pxor %xmm0, %xmm0
cvtsi2sd %eax, %xmm0
addsd (%rsi,%rax,8), %xmm0
movsd %xmm0, (%rdi,%rax,8)
addq $1, %rax
cmpq $100, %rax
jne .L2
rep ret

for宒 2
let itof = float_of_int
let f a b =
for i = 0 to 50 do
a.(i) <- b.(i) +. itof (i * 2);
a.(i+1) <-
b.(i+1) +. itof (i * 2 + 1);
done
.L101:
leaq -1(%rdi,%rdi), %rsi
sarq $1, %rsi
cvtsi2sdq %rdi, %xmm0
addsd 4(%rbx,%rdi,4), %xmm0
movsd %xmm0, 4(%rax,%rdi,4)
movq %rdi, %rsi
addq $2, %rdi
cmpq $101, %rsi
jne .L101
.L100:
movq $1, %rax
ret
camlFor2__f_1199:
.L102:
movq $1, %rdi
cmpq $101, %rdi
jg .L100

for宒2及
gcc 每O2
void f (double a[], double b[]){
for (int i = 0; i < 50; i++) {
a[i] = b[i] + i * 2;
a[i+1] = b[i+1] + (i + 1) * 2;
}}
.L2:
addsd -8(%rsi), %xmm0
addl $2, %eax
addq $8, %rsi
addq $8, %rdi
movsd %xmm0, -16(%rdi)
pxor %xmm0, %xmm0
movsd -8(%rsi), %xmm1
addsd %xmm0, %xmm1
movsd %xmm1, -8(%rdi)
cmpl $100, %eax
jne .L2
rep ret
f:
pxor %xmm0, %xmm0
xorl %eax, %eax
addq $8, %rsi
addq $8, %rdi

統蕉ㄩAtom 伊奈氾件扑
? Silvermont 失奈平氾弁民乓匹及伊奈氾件扑
? addsd
add + store, add + load支勻化中月韜鍔
每 xmm, xmm: 5
每 xmm, mem: 5 (!?!?
? movsd
load, store卅升手潭友月
每 xmm, xmm; xmm, mem; mem, xmm: 1
https://www.intel.com/content/www/us/en/architecture-and-technology/64-ia-32-architectures-optimization-manual.html

for宒3
let f a b =
for i = 0 to 100 do
for j = 0 to 100 do
a.(i).(j) <- 1.0;
done
done
.L103:
movq -4(%rax,%rbx,4), %rsi
movsd %xmm0, -4(%rsi,%rdi,4)
movq %rdi, %rsi
addq $2, %rdi
cmpq $201, %rsi
jne .L103
.L102:
movq %rbx, %rdi
addq $2, %rbx
cmpq $201, %rdi
jne .L101
.L100:
movq $1, %rax
.L104:
movq $1, %rbx
cmpq $201, %rbx
jg .L100
.L101:
movq $1, %rdi
cmpq $201, %rdi
jg .L102

for宒3 gcc 每O2
void f (double * a[],
double * b[]) {
for (int i = 0; i < 100; i++)
for (int j = 0; j < 100; j++)
a[i][j] = b[i][j] + i;
}
.L3:
movsd (%rdx,%rax), %xmm0
addsd %xmm1, %xmm0
movsd %xmm0, (%rcx,%rax)
addq $8, %rax
cmpq $800, %rax
jne .L3
addq $1, %r8
cmpq $100, %r8
jne .L2
rep ret
xorl %r8d, %r8d
.L2:
pxor %xmm1, %xmm1
movq (%rdi,%r8,8), %rcx
movq (%rsi,%r8,8), %rdx
xorl %eax, %eax
cvtsi2sd %r8d, %xmm1

for宒4 僕籵宒
let f a b c =
for i = 0 to 100 do
a.(i) <- a.(i) +. c.(i);
b.(i) <- a.(i) +. c.(i);
done
.L101:
movsd -4(%rax,%rsi,4), %xmm0
addsd -4(%rdi,%rsi,4), %xmm0
movsd %xmm0, -4(%rax,%rsi,4)
movsd -4(%rax,%rsi,4), %xmm0
addsd -4(%rdi,%rsi,4), %xmm0
movsd %xmm0, -4(%rbx,%rsi,4)
movq %rsi, %rdx
addq $2, %rsi
cmpq $201, %rdx
jne .L101
.L100:
movq $1, %rax
ret
.L102:
movq $1, %rsi
cmpq $201, %rsi
jg .L100

for宒4 gcc
void f (double a[],
double b[], double c[]) {
for (int i = 0; i < 100; i++) {
a[i] = a[i] + c[i];
b[i] = a[i] + c[i]; } }
f:
xorl %eax, %eax
.L2:
movsd (%rdi,%rax), %xmm0
addsd (%rdx,%rax), %xmm0
movsd %xmm0, (%rdi,%rax)
addsd (%rdx,%rax), %xmm0
movsd %xmm0, (%rsi,%rax)
addq $8, %rax
cmpq $800, %rax
jne .L2
rep ret
.L102:
movq $1, %rsi
cmpq $201, %rsi
jg .L100
SIMD趙今木化月
僕籵宒及壺�

for宒5 僕籵宒2
let f a b n =
for i = 0 to 100 do
a.(i) <- n +. 3.0;
b.(i) <- n +. 4.0;
done
f:
movsd .LC0(%rip), %xmm1
xorl %eax, %eax
addsd %xmm0, %xmm1
addsd .LC1(%rip), %xmm0
.L2:
movsd %xmm1, (%rdi,%rax)
movsd %xmm0, (%rsi,%rax)
addq $8, %rax
cmpq $800, %rax
jne .L2
rep ret

覜砑
? 砑砉仄凶午云曰及豇眻卅失本件皮仿互堤月
? 丐氏引曰僕籵宒午井龰日木卅中
? gcc午掀屯化堤懂化卅中醴蕾勾郔羥趙
每煦嶊及壺�ㄗㄐㄘ
每僕籵宒
每伙奈皿失件伕奈伉件弘ㄗ-O3)

match1
let f = function
| x :: xs -> [x]
| [] -> [0]
.L102:
subq $24, %r15
movq caml_young_limit
@GOTPCREL(%rip), %rax
cmpq (%rax), %r15
jb .L103
leaq 8(%r15), %rax
movq $2048, -8(%rax)
movq (%rbx), %rbx
movq %rbx, (%rax)
movq $1, 8(%rax)
addq $8, %rsp
ret
subq $8, %rsp
.L101:
movq %rax, %rbx
cmpq $1, %rbx
je .L100

list1
let f x =
x :: x :: x :: []
movq $1, 8(%rax)
leaq 24(%rax), %rdi
movq $2048, -8(%rdi)
movq %rbx, (%rdi)
movq %rax, 8(%rdi)
addq $48, %rax
movq $2048, -8(%rax)
movq %rbx, (%rax)
movq %rdi, 8(%rax)
addq $8, %rsp
ret
.L102:
call caml_call_gc@PLT
.L103:
jmp .L101
subq $8, %rsp
.L100:
movq %rax, %rbx
.L101:
subq $72, %r15
movq caml_young_limit
@GOTPCREL(%rip), %rax
cmpq (%rax), %r15
jb .L102
leaq 8(%r15), %rax
movq $2048, -8(%rax)
movq %rbx, (%rax)

引午戶ˋ
? 苤今中憝杅及asm卅日癶籵卞掂戶月
? OCaml戊件由奶仿反郔羥趙互逋曰卅中
每引丑GC及左奈田奈目永玉午井𠸎卞仄凶源互中中
每癶籵反丐氏引曰𠸎卞卅日卅中
? 伙奈皿及郔囀午井反𠸎卞仄凶幻丹互謎中
? 杅�毛�呾允月午五反float及malloc互五太仄中
奶件仿奶件桯嶱互衄�

端端舝

倏唬硃鳥梭及失本件皮仿毛掂戈趕

Recommended

More Related Content

What's hot (20)

Similar to 倏唬硃鳥梭及失本件皮仿毛掂戈趕 (20)

倏唬硃鳥梭及失本件皮仿毛掂戈趕