際際滷

際際滷Share a Scribd company logo
Problemy bazy danych
cd..
30 sekundowa analiza przyczyn powstawania problem坦w
Symptom driven diagnostic
 System wczesnego
ostrzegania (AI) Flopsar
informuje o narastajcych
problemach z czasem
odpowiedzi aplikacji.

 Problem powstaje nagle,
po weekendowym
wdro甜eniu nowej wersji
aplikacji.
Problem	pojawia	si	nagle,	po	
wdro甜eniu	aplikacji.	Problemy	
narastaj	(s	cige)
Brak	symptom坦w	
Problemy	dotycz	czasu	odpowiedzi	
aplikacji,	Jest	on	o	wiele	wy甜szy	ni甜	
typowo,	dotyczy	wielu	funkcji	aplikacji.
Root cause
 Problem	zostaje	skontenerowany	do	dw坦ch	funkcji:	
 doSelect/executeQuery	
 read/write	
 Kontenerowanie	odbywa	si	na	dedykowanym	panelu.	Nie	wymaga	
jest	jego	kon鍖guracja.	
 Inne	parametry	aplikacji	s	w	normie		
 Obie	funkcje	s	charakterystyczne	dla	problem坦w	z	niewydajn	
baz	danych.	Wykres	DuraMon/CPU	pokazuje,	甜e	prawie	100%	
czasu	aplikacja	spdza	poza	serwerem.	Nie	nale甜y	wic	szuka	
przyczyny	(i	optymalizowa)	w	serwerze	aplikacji	(komponentach	
aplikacji)	
 Dla	upewnienia	si,	甜e	wstpna	diagnoza	jest	poprawna	operator	
wery鍖kuje	map	czas坦w	odpowiedzi	aplikacji,	aby	pozna	szczeg坦y
Mapa wydajnoci
Szereg	komin坦w	pokazujcych,	甜e	
czas	odpowiedzi	jest	wysoki	(dochodzi	
do	22	sekund).	95%	odpowiedzi	
generowane	jest	jednak	w	czasie	do	2	
sekund
Kto jest winny?
Kominy	powstaj	poza	serwerem.	
Ponad	99%	czasu	jest	tracone	na	
oczekiwanie
Kto jest winny. Precyzyjna diagnoza
Mamy	problem	z	pisaniem/czytaniem	
danych,	oraz	wykonywaniem	zapyta	
bazodanowych	(doSelect)
Mo甜liwo	obejrzenia	pojedynczych	
wywoa	zawierajcych	podejrzane	
metody
Stack wywoania
Stack wywoania cd
Wnioski
 Ka甜de zapytanie bazodanowe (select 1, select count(),
select  from..) trwa powy甜ej 1 sekundy.

 Transport danych oraz odbi坦r wynik坦w (write/read)
trwa powy甜ej 50 ms dla kilkunastu bajt坦w

 Wskazuje to problem nadmiernego obci甜enia bazy
danych. Nie jest ona w stanie poprawnie realizowa
swoich dziaa.
Rozwiazanie
 Przygotowujc wdro甜enie,
administratorzy popenili bd przy
konfiguracji skryptu docker-owego
dla bazy.

 Zosta wdro甜ony skrypt ze
rodowiska developerskiego

 Zawiera on istotne ograniczenia
bazy - w wykorzystaniu
procesora i pamici.

 Po zniesieniu limit坦w i restarcie bazy
danych, wszytko wr坦cio do normy
Wnioski kocowe
 Caa analiza trwaa poni甜ej jednej minuty, uruchomiono
poprawne rodowisko w kolejnych 10. Caa awaria trwaa
wic okoo 15 minut.

 Czy dao by si okreli przyczyn tej awarii bez Flopsar?

 Oczywicie 甜e tak.

 Pytanie otwarte - jakimi zasobami i w jakim czasie.

More Related Content

Flopsar db-problem