2. Symptom driven diagnostic
System wczesnego
ostrzegania (AI) Flopsar
informuje o narastajcych
problemach z czasem
odpowiedzi aplikacji.
Problem powstaje nagle,
po weekendowym
wdro甜eniu nowej wersji
aplikacji.
Problem pojawia si nagle, po
wdro甜eniu aplikacji. Problemy
narastaj (s cige)
Brak symptom坦w
Problemy dotycz czasu odpowiedzi
aplikacji, Jest on o wiele wy甜szy ni甜
typowo, dotyczy wielu funkcji aplikacji.
3. Root cause
Problem zostaje skontenerowany do dw坦ch funkcji:
doSelect/executeQuery
read/write
Kontenerowanie odbywa si na dedykowanym panelu. Nie wymaga
jest jego kon鍖guracja.
Inne parametry aplikacji s w normie
Obie funkcje s charakterystyczne dla problem坦w z niewydajn
baz danych. Wykres DuraMon/CPU pokazuje, 甜e prawie 100%
czasu aplikacja spdza poza serwerem. Nie nale甜y wic szuka
przyczyny (i optymalizowa) w serwerze aplikacji (komponentach
aplikacji)
Dla upewnienia si, 甜e wstpna diagnoza jest poprawna operator
wery鍖kuje map czas坦w odpowiedzi aplikacji, aby pozna szczeg坦y
6. Kto jest winny. Precyzyjna diagnoza
Mamy problem z pisaniem/czytaniem
danych, oraz wykonywaniem zapyta
bazodanowych (doSelect)
Mo甜liwo obejrzenia pojedynczych
wywoa zawierajcych podejrzane
metody
9. Wnioski
Ka甜de zapytanie bazodanowe (select 1, select count(),
select from..) trwa powy甜ej 1 sekundy.
Transport danych oraz odbi坦r wynik坦w (write/read)
trwa powy甜ej 50 ms dla kilkunastu bajt坦w
Wskazuje to problem nadmiernego obci甜enia bazy
danych. Nie jest ona w stanie poprawnie realizowa
swoich dziaa.
10. Rozwiazanie
Przygotowujc wdro甜enie,
administratorzy popenili bd przy
konfiguracji skryptu docker-owego
dla bazy.
Zosta wdro甜ony skrypt ze
rodowiska developerskiego
Zawiera on istotne ograniczenia
bazy - w wykorzystaniu
procesora i pamici.
Po zniesieniu limit坦w i restarcie bazy
danych, wszytko wr坦cio do normy
11. Wnioski kocowe
Caa analiza trwaa poni甜ej jednej minuty, uruchomiono
poprawne rodowisko w kolejnych 10. Caa awaria trwaa
wic okoo 15 minut.
Czy dao by si okreli przyczyn tej awarii bez Flopsar?
Oczywicie 甜e tak.
Pytanie otwarte - jakimi zasobami i w jakim czasie.