Skalowanie Bacula na przykładach

radekk, śr., 2012-03-28 17:41

Klienci często mnie pytają czy Bacula Enterprise jest dla nich odpowiednio skalowalna. Jako skalowanie mają na myśli dwa podstawowe elementy: ilość możliwych do obsłużenia klientów (generalnie zadań backupowych) oraz ilość obsługiwanych plików w pojedynczej bazie katalogowej. W przypadku oprogramowania Bacula Enterprise zarówno ilość obsługiwanych klientów (zadań), jak i ilość obsługiwanych plików nie jest technicznie ograniczona i w rzeczywistych środowiskach zależy głównie od dostępnych zasobów serwera na którym działają Bacula Director oraz bazy katalogowe. Specjalnie w poprzednim zdaniu użyłem liczby mnogiej, gdyż Bacula Enterprise ma możliwość jednoczesnej obsługi większej ilości baz katalogowych, które przechowują informacje o backupach poszczególnych klientów. Faktycznie działające instalacje na świecie moga poszczycić się ponad 130M plików obsługiwanych w pojedynczej bazie katalogowej oraz obsługę ponad 2000 klientów przez pojedynczy Bacula Director. To sporo, może nawet lepiej niż komercyjna konkurencja. Jednak opisywanie i chwalenie się usłyszanymi (nawet formalnymi referencjami) nie jest tak przekonujące jak własne doświadczenia. Postanowiłem więc wykonać kilka testów do których zmobilizował mnie jeden z klientów (pozdrawiam koleżankę Gosię :)) chcący mieć potwierdzenie, że skalowalność Bacula nie jest tylko mityczna.

Test jaki chciałem wykonać to wykonanie backupu oraz budowanie drzewa odtwarzania dla środowiska zawierającego ponad 6M plików backupowanych w pojedynczym zadaniu. Na początek specyfikacja środowiska:

Jako serwer testowy posłuży nam maszyna wirtualna o poniższych parametrach:
# lscpu
Architecture:          x86_64
CPU op-mode(s):        64-bit
CPU(s):                2
Thread(s) per core:    1
Core(s) per socket:    1
CPU socket(s):         2
NUMA node(s):          1
Vendor ID:             GenuineIntel
CPU family:            6
Model:                 2
Stepping:              3
CPU MHz:               3411.978
Hypervisor vendor:     KVM
Virtualization type:   full
L1d cache:             32K
L1i cache:             32K
L2 cache:              4096K

# free
             total       used       free     shared    buffers     cached
Mem:       2061392    1656472     404920          0        684     896068
-/+ buffers/cache:     759720    1301672
Swap:       385016        420     384596

Jest to więc niewielkie środowisko testowe o bardziej niż ograniczonych zasobach.
Backupowane zasoby to katalog /data/test o wspomnienej wcześniej ilości plików:

# find /data/test -print|wc -l
6040201

Uruchamiamy zadanie.

| jobid | name          | starttime           | type | level | jobfiles  | jobbytes | jobstatus |
+-------+---------------+---------------------+------+-------+-----------+----------+-----------+
|     1 | BackupClient1 | 2012-03-28 11:11:03 | B    | F     | 6,040,201 |        0 | T         |

Zadanie wykonane, teraz rozpoczynamy procedurę testów budowy drzewa odtwarzania. Wybieramy wykonane wcześniej zadanie i już po niecałej 1,5min możemy dowoli wybierać pliki (poniższe logi zostały przycięte wyłącznie do interesujacych informacji):

# time echo "restore jobid=1" | bconsole
You have selected the following JobId: 1

Building directory tree for JobId(s) 1 ...  +++++++++++++++++++++++++++++++++++++++++++++++++
6,000,000 files inserted into the tree.

cwd is: /
$
real    1m23.276s
user    0m0.008s
sys     0m0.000s

We wskazanym powyżej zadaniu Bacula musiała wykonać dwa czasochłonne kroki: najpierw pobrać z bazy danych wszystkie pliki należące do wskazanego zadania a następnie w pamięci zbudować drzewo katalogów tak aby możliwe było bardzo szybkie przeglądanie i wybieranie plików do odtworzenia. Szybkość może wynikać z tego, że w bazie katalogowej znajduje się tylko 6M plików, zróbmy więc kolejny backup i test odtwarzania:

# time echo restore jobid=2|bconsole
You have selected the following JobId: 2

Building directory tree for JobId(s) 2 ...  +++++++++++++++++++++++++++++++++++++++++++++++++
6,000,000 files inserted into the tree.

cwd is: /
$
real    1m57.407s
user    0m0.016s
sys     0m0.000s

Jak widać czas się nieznacznie wydłużył i w dalszym ciągu czas budowania jest relatywnie niewielki. Sprawdzmy także czy ilość danych w bazie wpłynęła na inne backupy, np. bardzo małe:

# time echo restore jobid=5|bconsole
You have selected the following JobId: 5

Building directory tree for JobId(s) 5 ...  ++++++++++++++++++++++++++++++++++++++
115 files inserted into the tree.

cwd is: /
$
real    0m0.048s
user    0m0.008s
sys     0m0.000s

Jak widać absolutnie nie wpływa. To potwierdza, że czas budowania drzewa odtwarzania zależy w głównej mierze od ilości plików w danym zadaniu backupowym a nie od ilości plików w całej bazie katalogowej.
Sprawdźmy także jak wygląda budowanie drzewa dla zadań Full + Incremental (w naszym przykładzie incr zmienił ok. 20k plików):

# time echo restore jobid=2,6|bconsole
You have selected the following JobIds: 2,6

Building directory tree for JobId(s) 2,6 ...  +++++++++++++++++++++++++++++++++++++++++++++++++
6,000,000 files inserted into the tree.

cwd is: /
$
real    2m11.753s
user    0m0.008s
sys     0m0.004s

Troszkę dłużej niż w sam backup Full. To może kolejne przyrostowe???

# time echo restore jobid=2,6,7|bconsole
You have selected the following JobIds: 2,6,7

Building directory tree for JobId(s) 2,6,7 ...  +++++++++++++++++++++++++++++++++++++++++++++++++
6,000,000 files inserted into the tree.

cwd is: /
$
real    2m19.992s
user    0m0.008s
sys     0m0.016s

# time echo restore jobid=2,6,7,8|bconsole
You have selected the following JobIds: 2,6,7,8

Building directory tree for JobId(s) 2,6,7,8 ...  +++++++++++++++++++++++++++++++++++++++++++++++++
6,000,000 files inserted into the tree.

cwd is: /
$
real    2m5.344s
user    0m0.008s
sys     0m0.004s

Z powyższych przykładów widać, że backupy przyrostowe nie za bardzo zmieniają uzyskane czasy i są one praktycznie stałe.

Podstawowym czynnikiem ograniczającym wydajność procesu budowania drzewa odtwarzania jest wielkość pamieci serwera i pamięci przydzielonej dla silnika bazodanowego. W przykładowym teście PostgreSQL otrzymał 1024MB pamięci dzielonej co przy 2GB fizycznej pamięci dla serwera skutkowało niewielkim swapowaniem (swap ok. 15MB-20MB). Poza tym środowisko nie było praktycznie tuningowane ani optymalizowane. Parametry testowego serwera były niewiele lepsze od dostępnych aktualnie na rynku tabletów czy smartfonów. Mimo tego osiągnięte wyniki są rewelacyjne!

Ładnie, jak przy 7,867,178

Anonim, pt., 2015-08-21 14:29

Ładnie, jak przy 7,867,178 files

cwd is: /
$
real 5m39.337s

Baza MySQL, staram się coś podkręcić.

odpowiedz

Może PGSQL?

radekk, śr., 2015-09-30 14:41

Nie chciałbym być złośliwy, ale ja "tuning" rozpoczął bym od migracji na PostgreSQL. Wprawdzie 7M plików w jednym zadaniu to sporo, a finalnie liczy się całkowita wielkość bazy danych, w której może być 100M czy 500M plików. Wtedy silnik będzie miał znaczenie.

—

Radosław Korzeniewski

odpowiedz

Modyfiakcja bazy danych

Anonim, pt., 2015-08-21 17:15

Modyfiakcja bazy danych przyniosła nawet niezły wynik:

linux-backup-01 ~ # time echo "restore jobid=529" | bconsole
Connecting to Director 10.9.254.10:9101
1000 OK: 1 beyond-backup-dir Version: 7.0.5 (28 July 2014)
Enter a period to cancel a command.
restore jobid=529
Automatically selected Catalog: PrimaryCatalog
Using Catalog "PrimaryCatalog"
You have selected the following JobId: 529

Building directory tree for JobId(s) 529 ... +++++++++++++++++++++++++++++++++++++++++++++
7,867,178 files inserted into the tree.

You are now entering file selection mode where you add (mark) and
remove (unmark) files to be restored. No files are initially added, unless
you used the "all" keyword on the command line.
Enter "done" to leave this mode.

cwd is: /
$
real   1m36.503s
user   0m0.016s
sys   0m0.006s

odpowiedz

Gratulacje.

radekk, śr., 2015-09-30 14:42

Gratuluję! Ciekaw jestem jak to by wyglądało na stuningowanym PostgreSQL?

—

Radosław Korzeniewski

odpowiedz

Skalowanie Bacula na przykładach - Bacula Enterprise

Anonim, śr., 2024-11-13 03:49

「問題提起（二）戦争の放棄」（憲法改正草案研究会配布資料、1970年7月）。「問題提起（一）新憲法における『日本』の欠落」（憲法改正草案研究会配布資料、1970年5月）。中村光夫「『金閣寺』について」（文藝 1956年12月号）。新潮文庫版『金閣寺』解説（1960年9月）。「戯曲を書きたがる小説書きのノート」（日本演劇 1949年10月号）pp.
8

odpowiedz

Skalowanie Bacula na przykładach - Bacula Enterprise

Anonim, śr., 2024-11-13 05:04

前身企業である田園都市（株）、目黒蒲田電鉄、および（旧）東京横浜電鉄から大東急までの各会社の時代の詳細な年表は、それぞれ「田園都市（株）」、「目黒蒲田電鉄」、および「東京横浜電鉄」の各社史年表を、多摩田園都市開発に関しては「多摩田園都市開発年表」を参照のこと。また、健康保険組合も東横目蒲電鉄健康保険組合（1935年4月1日設立）を祖とし、大東急時代に東京急行電鉄健康保険組合となり、これが東京西南私鉄連合健康保険組合と名称変更した

odpowiedz

Skalowanie Bacula na przykładach - Bacula Enterprise

Anonim, czw., 2024-10-10 10:23

主なカバー：真田アサミ（本人出演のアニメ「ウィンターガーデン」のエンディング・クリスマスが過ぎても（PLUS ONE（小田和正・ 7月1日に一本足打法を披露したものの、その後に国鉄の金田に同弱点を見破られ、早くも壁にぶつかることになった。 5月1

odpowiedz

Skalowanie Bacula na przykładach - Bacula Enterprise

Anonim, pt., 2024-10-25 23:53

榛軒は屡儆（いまし）めたが功が無かつた。榛軒の家に開かれた源氏物語の講筵には、寿阿弥と此人とが請ぜられた。榛軒門人録には「渋江道陸」として載せてある。隆白は後津軽家の表医師に任ぜられ、金十八両六人扶持を受けた。貞白の弟は或旗下の家の用人が養つて嗣とした。貞白は大いに慙ぢてこれに倣つた。同窓の須川隆白は、同じ弘前藩の子弟であつたので、常に恒善を推重し、寝具の揚卸、室内の掃除は自らこれに任じ、恒善に手を下させなかつた。 28日

r>
スイス経済省経済事務局は7-9月の国内総生産が前期比0.4%増と発表した

odpowiedz