Presentation slides from InternetBeta2011 talk about "How to handle cloud failure.".
1 of 17
Download to read offline
More Related Content
Piorunem w chmur?. InternetBeta 2011
1. Piorunem w chmur?
re?eksje AdTaily na temat
bezpiecze¨½stwa serwer¨®w w cloudzie
Grzegorz Kochan | grzegorz@adtaily.com 1
2. AdTaily
w liczbach
~ 1,5 mld ods?on widgetu miesi?cznie
~ 100 000 klikni?? w reklam? dziennie
ponad 1500 reqest¨®w na sekund?
ponad 150 mbit na sekund?
35 tysi?cy zarejestrowanych wydawc¨®w
15 tysi?cy reklamodawc¨®w
Grzegorz Kochan | grzegorz@adtaily.com 2
3. Startup w chmurze
zalety wirtualnej serwerowni
?atwo?? implementacji
wygoda zarz?dzania
?nieograniczona¡± skalowalno??
cena proporcjonalna do potrzeb
API
Grzegorz Kochan | grzegorz@adtaily.com 3
4. Us?ugi w cloudzie
na przyk?adzie Amazon AWS
EC2 - serwery wirtualne
S3 - hosting statyczny
SQS - kolejkowanie wiadomo?ci
EBS - przestrze¨½ dyskowa
RDS - relacyjna baza danych
i wiele innych
Grzegorz Kochan | grzegorz@adtaily.com 4
5. Us?ugi pod lup?
na przyk?adzie Amazon AWS
EC2 - w razie awarii tracisz dane
S3 - wysoka cena przy malych plikach
SQS - w razie bledu tracisz dane
EBS - wolne I/O, w razie awarii tracisz dane
RDS - oparte o EBS
etc
Grzegorz Kochan | grzegorz@adtaily.com 5
6. µþ±ð³ú±è¾±±ð³¦³ú±ð¨½²õ³Ù·É´Ç
podstawowe kroki
Redundancja instancji i us?ug
Rozci?gni?cie infrastruktury geogra?cznie
Instancje oparte o EBS
Snapshoty
Kopie zapasowe na S3
Replikacja danych
Grzegorz Kochan | grzegorz@adtaily.com 6
7. Czy to wystarczy?
zderzenie z rzeczywisto?ci?
TechCrunch
¡°Amazon EC2 goes down, taking with it Reddit,
Foursquare and Quora¡± - kwiecie¨½ 2011
?Down Goes The Internet¡ Again. Amazon EC2
Outage Takes Down Foursquare, Instagram,
Quora, Reddit, Etc¡± - sierpie¨½ 2011
Grzegorz Kochan | grzegorz@adtaily.com 7
8. Katastrofa
de?nicja
katastrofa [gr.], lit. kl?ska, kt¨®r? ponosi
bohater tragedii;
katastrofa ekologiczna, trwa?e
(nieodwracalne w naturalny spos¨®b)
uszkodzenie lub zniszczenie du?ego obszaru
?rodowiska przyrodnicze
katastrofa IT, ka?da awaria na kt¨®r? nie
jeste? przygotowany
Grzegorz Kochan | grzegorz@adtaily.com 8
9. ?Odwaga jest to wiedza o tym,
czego si? ba?, a czego nie.¡±
Platon
Grzegorz Kochan | grzegorz@adtaily.com 9
10. Akceptowalne ryzyko
akceptowalne koszta
bezpiecze¨½stwo kosztuje
dla startupu rozw¨®j jest najwa?niejszy
zale?y od charakteru i skali biznesu
Grzegorz Kochan | grzegorz@adtaily.com 10
11. Akceptowalne koszta
nieakceptowalne ryzyko
Grzegorz Kochan | grzegorz@adtaily.com 11
12. Lessons learned
czas na wnioski
awarii nie unikniesz, katastrofy owszem
informuj u?ytkownik¨®w o stanie us?ug
projektuj architektur? uwzgl?dniaj?c? awarie
cyklicznie wery?kuj akceptowalne ryzyko
rozwijaj, testuj i automatyzuj plan awaryjny
Grzegorz Kochan | grzegorz@adtaily.com 12
13. ¡°The only way to fail is to fail constantly.¡±
Grzegorz Kochan | grzegorz@adtaily.com 13
14. Chaos Monkey
nie czekaj na awari?
proces losowo wy??czaj?cy us?ugi
ci?g?e testowanie odporno?ci na awari?
pewno?? i swoboda rozwoju
Grzegorz Kochan | grzegorz@adtaily.com 14
15. W praktyce
aktualnie w Adtaily
automatyzacja zarz?dzania infrastruktur?
dekompozycja aplikacji
rozproszenie infrastruktury i us?ug
awaria jako stan dzia?ania aplikacji
Grzegorz Kochan | grzegorz@adtaily.com 15
16. 2 rzeczy
na wynos
Cloud is not a solution, it¡¯s just a tool.
Learn to use it.
Design for failure.
Grzegorz Kochan | grzegorz@adtaily.com 16
17. Dzi?kuj?. Pytania?
Grzegorz Kochan
CTO & VP of Products w AdTaily
email: grzegorz@adtaily.com
www.adtaily.pl
facebook.com/adtaily
http://adtai.ly/InternetBeta2011
Grzegorz Kochan | grzegorz@adtaily.com 17