Glusterfs vs. Ceph: ¿Cuál gana la guerra de almacenamiento?

Almacenar datos a escala no es como guardar un archivo en su disco duro. Requiere un administrador de software para realizar un seguimiento de todos los bits que componen los archivos de su empresa. Ahí es donde entran en juego los paquetes de administración de almacenamiento distribuido como Ceph y Gluster.

Ceph y Gluster son sistemas que se utilizan para administrar el almacenamiento distribuido. Ambos se consideran almacenamiento definido por software, lo que significa que son en gran medida independientes del hardware. Organizan los bits que componen sus datos utilizando su propia infraestructura subyacente, que es lo que define esta elección: ¿qué marco subyacente desea que respalde sus datos?

Esa es una decisión que desea tomar en función del tipo de datos que está almacenando, cómo se accede a esos datos y dónde se encuentran esos datos. Ceph y GlusterFS son buenas opciones, pero sus aplicaciones ideales son sutilmente diferentes.

Almacenamiento basado en objetos para datos no estructurados: Ceph

Gluster frente a Ceph Solución Ceph Clúster de almacenamiento

cefalograma es un sistema basado en objetos, lo que significa que gestiona los datos almacenados como objetos en lugar de como una jerarquía de archivos, distribuyendo datos binarios en todo el clúster. Facebook utiliza métodos de almacenamiento de objetos similares para almacenar imágenes y Dropbox para almacenar archivos de clientes. En general, el almacenamiento de objetos admite datos masivos no estructurados, por lo que es perfecto para el almacenamiento de datos a gran escala. El sistema se mantiene mediante una red de demonios en forma de monitores de clúster, servidores de metadatos y almacenamiento registrado. Estos se combinan para hacer que Ceph sea capaz pero más complejo que la competencia.

El almacenamiento poco común basado en objetos y bloques significa que Ceph utiliza sus propias herramientas para administrar el almacenamiento. Esto requiere que los administradores del sistema se familiaricen con las herramientas de Ceph. El verdadero funcionamiento interno de Ceph puede ser difícil de entender a primera vista. Básicamente, debe estar dispuesto a aprender cómo funciona para obtener los beneficios. El sistema autoadministrado y autorreparable puede reducir los gastos operativos continuos con el tiempo, y Ceph puede ejecutarse en hardware de servidor estándar de la industria.

El sistema también puede crear almacenamiento en bloque, proporcionando acceso a imágenes de dispositivos en bloque que se pueden eliminar y replicar en todo el clúster. Las aplicaciones pueden acceder a Ceph Object Storage a través de una interfaz RESTful que admite las API de Amazon S3 y Openstack Swift. El objetivo es alto rendimiento, almacenamiento masivo y compatibilidad con el código heredado.

Almacenamiento de bloques en árboles jerárquicos: GlusterFS

Glusterfs Gluster Fsintroducción 11 638

GlusterFS, más conocido como Gluster, es un almacén de archivos más tradicional. Es fácil de configurar y se puede usar una compilación correctamente compilada en cualquier sistema que tenga una carpeta. La flexibilidad y facilidad de uso es una gran ventaja del sistema. Si bien puede escalar a enormes capacidades, el rendimiento tiende a degradarse rápidamente. Es más adecuado para tamaños de archivo promedio grandes (superiores a 4 MB) y acceso secuencial. Un clúster puede distribuirse entre servidores físicos, virtuales y en la nube, lo que permite una virtualización de almacenamiento flexible.

Gluster utiliza almacenamiento en bloque, lo que significa que se almacenan fragmentos de datos en espacios abiertos en dispositivos de clúster conectados. El almacenamiento basado en archivos y bloques utiliza un sistema de archivos que organiza los archivos en árboles jerárquicos. Agrega servidores geográficamente distintos a través de Ethernet para crear un sistema de archivos de red paralelo escalable. Gluster es esencialmente una versión basada en clúster de FUSE y NFS, que proporciona una arquitectura familiar para la mayoría de los administradores de sistemas. Está destinado a ser simple, fácil de mantener y ampliamente utilizable, pero no tiene la velocidad de acceso que Ceph puede ofrecer en las circunstancias adecuadas.

Conclusión

Ceph se adapta mejor al acceso rápido a datos no estructurados, que constituyen la gran mayoría de los archivos del mundo. Gluster es mejor para el acceso a datos secuenciales, como la transmisión de video, o para aplicaciones donde la velocidad no es tan importante, como la copia de seguridad.

¿Qué sistema de almacenamiento de archivos está utilizando?

Publicaciones Similares

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *