Ceph

Rozproszony system mass-storage ktory pozwala nam budować wyjątkowo elastyczne poziomy przechowywania pamięci masowej

Ceph - ceph

Co to jest Ceph?

Ceph to rozproszony system pamięci masowej typu open source, który można skalować do tysięcy nodów (komputerów), oferując petabajty wydajnej, bezpiecznej i wysoce dostępnej rozproszonej pamięci masowej.

Jaka jest rola Ceph?

Ceph dzieli dane użytkownika na małe fragmenty, które są dystrybuowane na wielu serwerach z określoną przez zasady liczbą kopii. Klienci Ceph używają algorytmu haszującego do określenia lokalizacji danych, pobierając je bezpośrednio z odpowiedniego serwera, bez życia Proxy / Gateway, co stanowiłoby wąskie gardło przepustowości lub pojedynczy punkt awarii systemu.

Chociaż wewnętrznie Ceph jest systemem obiektowej pamięci masowej, może być używany do świadczenia usług pamięci masowej w postaci bloków (lub wolumenów), które można zamontować w maszynie wirtualnej, obiektowej pamięci masowej, do której można uzyskać dostęp za pośrednictwem interfejsu HTTP RESTFull S3 lub SWIFT. Może być również używany jako sieciowy system plików, do którego można uzyskać dostęp z wielu serwerów.

Ceph - data center
Elastyczne poziomy przechowywania

Ceph pozwala nam budować wyjątkowo elastyczne poziomy przechowywania pamięci masowej, łącząc dyski HDD, SSD i NVMe, wykorzystując zalety każdego typu nośnika. Ceph pozwala na elastyczną konfigurację dodatkowych funkcji, takich jak typ i poziom redundancji (liczba replikowanych lub zakodowanych kopii), strategia buforowania lub dystrybucja danych (np. Anty-koligacja na poziomie serwera, szafy serwerowej lub poziomu), kompresja i szyfrowanie danych.

Te możliwości w połączeniu z odpowiednim doborem sprzętu (dysku, serwera i rozmiaru sieci) pozwalają nam budować usługi pamięci masowej idealnie dostosowane do potrzeb klientów-od wydajnych replikowanych wolumenów pamięci masowej opartej na dyskach SSD do niedrogich, zakodowanych z wymazywaniem obiektów HDD w skali rzędu petabajtów.

Ceph - server
Bezpieczeństwo i niezawodność

System jest w pełni odporny na awarie sprzętu-w tym dysków, serwerów czy komponentów sieciowych. W przypadku awarii dysku lub serwera, skutkującej utratą danych, Ceph automatycznie przywraca redundancję danych poprzez replikację brakujących danych z innej kopii, aby przywrócić określony poziom redundancji. Ponadto Ceph utrzymuje CRC na poziomie obiektu i wykonuje ciągłe czyszczenie danych w celu wykrywania i proaktywnej naprawy uszkodzonych obiektów danych.

Komponenty sieciowe są w pełni redundantne z topologią modelu „Spine-Leaf” i podwójnymi połączeniami z każdym serwerem. Ceph zapewnia również kilka funkcji związanych z bezpieczeństwem, takich jak szyfrowanie danych podczas przesyłania i spoczynku, zarządzanie prawami dostępu i silne uwierzytelnianie użytkowników.

Ceph - cloud
Bogata funkcjonalność

Ceph zapewnia bogaty zestaw funkcji dla każdego oferowanego wolumenu, obiektu i systemu plików. Usługa wolumenu zapewnia użytkownikom blokowe woluminy pamięci masowej, które mogą być używane w maszynach wirtualnych. Bloki pamięci dostarczone przez Ceph mogą być używane jako woluminy startowe lub rozszerzone, które można podłączyć do działającej maszyny wirtualnej. Ceph zapewnia takie funkcje jak alokowanie elastyczne, natychmiastowe migawki, tworzenie kopii zapasowych w tle i zmiana rozmiaru wolumenu.

Dzięki mechanizmowi dystrybucji danych, rozmiary wolumenów są praktycznie nieograniczone, a ich wydajność rośnie wraz z rozmiarem.

Ceph - diagram
Skalowalny do dziesiątków Petabajtów

Klastry Ceph zostały stworzone do świadczenia usług pamięci masowej w skali rzędu petabajtów. Klastry można skalować w poziomie przez dodanie dodatkowych nodów (komputerów). Po dodaniu dodatkowych węzłów Ceph automatycznie ponownie balansuje klaster, aby wyrównać wykorzystanie i obciążenie przestrzeni dyskowej. Ponowne równoważenie odbywa się w tle, bez przerywania operacji klastra. Dodatkowe nody zwiększają nie tylko pojemność klastra, ale także jego całkowitą przepustowość.

Ceph jest również wyposażony w automatyczne wykrywanie błędów, czyszczenie danych i mechanizmy naprawy, które zapewniają odporność danych na dużą skalę.

Ceph - 6 cloud computing
W pełni zintegrowany z OpenStack

Ceph jest preferowanym zapleczem pamięci masowej dla chmur opartych na OpenStack. Świadczy usługi dla blokowej pamięci masowej maszyn wirtualnych, umożliwiając takie funkcje, jak alokowanie elastyczne, migawki, rozszerzenie wolumenu i migracja działających maszyn wirtualnych. Ceph jest również używany przez Image Service do przechowywania obrazów systemu, które są używane przez uruchomione maszyny wirtualne.

Ceph wykorzystywany jest także do świadczenia usług S3 i SWIFT Object Storage Services w OpenStack. Dzięki starannemu dostrojeniu i zaprojektowaniu pul danych używanych przez różne usługi pamięci masowej OpenStack, Ceph zapewnia wydajność i funkcjonalność dostosowaną do różnych scenariuszy użytkowania w opłacalny sposób.

Ceph - save money
Ekonomiczny i ekologiczny

Ceph został zaprojektowany od podstaw, aby budować duże bazy danych w opłacalny sposób. Opierając się na standardowych, gotowych komponentach sprzętowych, najlepiej wykorzystuje nowoczesne technologie pamięci masowej, takie jak NVMe, dyski SSD i HDD, wykorzystując ich specyficzne możliwości. Drogie NVMe-y służą do przechowywania małych, ale często używanych elementów danych, takich jak indeksy i metadane, co pozwala na szybkie działanie całego klastra.

Dyski SSD zapewniają wydajność zorientowaną na IOPS, a niedrogie dyski twarde są używane w aplikacjach ekonomicznych, wymagających dużych ilości danych. Funkcje kompresji oraz Erasure-Coding (EC) pozwalają na oszczędność kosztów i energii poprzez zmniejszenie kosztów ogólnych, potrzebnych do redundancji danych nawet o 66%, co pozwala na ekologiczne i ekonomiczne przechowywanie danych.

Zobacz także