En términos informáticos, el archivo es un archivo único que almacena dentro de sí mismo diferentes archivos y carpetas. Hay varios formatos de archivo disponibles y cada uno tiene sus pros y sus contras. Algunos formatos de archivo vienen con soporte de compresión (lo que hace que el tamaño de su archivo sea más pequeño), mientras que otros admiten el cifrado. Sí, y lo adivinó, algunos formatos de archivo admiten tanto la compresión como el cifrado. Averigüemos más sobre los algoritmos de compresión y cifrado utilizados y los diversos formatos de archivo.
Algoritmo de compresión
El algoritmo de compresión es el método utilizado por el archivo para comprimir los archivos y reducir el tamaño total del archivo.
1. LZMA/LZMA2
El algoritmo de cadena Lempel-Ziv-Markov (LZMA) es un algoritmo de compresión de datos sin pérdidas. LZMA utiliza un algoritmo de compresión de diccionario que utiliza estructuras de datos complejas para codificar un bit a la vez.
LZMA2 es un contenedor que contiene datos sin comprimir y comprimidos con LZMA. Es compatible con la compresión y descompresión de datos de subprocesos múltiples. También puede comprimir datos que no se pueden comprimir con otros algoritmos de compresión.
2. Algoritmo de transformación de Burrows-Wheeler (BWT)
BWT funciona permutando una cadena de texto en orden y luego comprimiéndola reemplazando los caracteres repetidos en símbolos.
3. ppm
La predicción por coincidencia parcial (PPM) es un método de compresión de datos estadísticos que funciona mediante el uso de un conjunto de símbolos anteriores en el flujo de símbolos sin comprimir para predecir el siguiente símbolo en el flujo.
4. Desinflar
Deflate es un algoritmo de compresión de datos popular que utiliza una combinación de algoritmos de codificación LZ77 y Huffman para comprimir datos (combinando algoritmos LZMA y PPM para producir más compresión). Dado que Deflate no contiene implementaciones restringidas por patentes, se ha vuelto muy popular y se usa ampliamente, especialmente en Linux.
Algoritmo de cifrado
Ahora veamos algunos de los métodos de encriptación populares:
1. DES
El estándar de cifrado de datos utiliza claves secretas privadas para cifrar y descifrar datos. La clave secreta se selecciona aleatoriamente de un espacio de direcciones de 56 a 64 bits.
2. AES
Advanced Encryption Standard es un algoritmo de cifrado utilizado por las agencias de EE. UU. para proteger los datos confidenciales. Puede encriptar datos usando 128, 192 y 256 bits de encriptación. AES usa un algoritmo de clave simétrica, lo que significa que se usa una clave común para cifrar y luego descifrar los datos.
3. pez globo
El algoritmo de cifrado Blowfish cifra los archivos con un tamaño de bloque de 64 bits y una longitud de clave variable de 32 a 448 bits.
Nota: Hay varios otros algoritmos de cifrado, pero los tres mencionados anteriormente son los más utilizados.
Formatos de archivo
Hay varios formatos de archivo disponibles. A continuación, evaluaremos cada formato de archivo utilizando tres parámetros: si admite compresión y encriptación, qué sistema operativo y software están disponibles para su uso.
1. alquitrán
Tape Archive (Tar) es uno de los formatos de archivo más antiguos. Inicialmente, se utilizó para combinar y escribir datos en unidades de cinta secuenciales, pero luego se estandarizó como un formato de compresión. Tar se usa principalmente en Linux y no admite compresión ni cifrado. También puede usarlo en Windows con la instalación de software adicional. La mayoría de las utilidades de archivo modernas admiten este formato. Las excepciones incluyen Disk Archiver y KGB Archiver.
2. GZ
GZ o GZip es uno de los formatos de compresión más populares utilizados tanto en Windows como en Linux. GZip usó el algoritmo de compresión Deflate para comprimir los archivos archivados. GZip también admite transferencias de archivos de varias partes, lo que significa que puede crear partes más pequeñas de un archivo GZip grande para compartirlo y transferirlo fácilmente. Dado que GZip es bastante popular, la mayoría de las utilidades de archivo modernas tienen soporte para comprimir y descomprimir archivos utilizando el formato GZip, incluidos 7-Zip, BetterZip, PKZip, WinZip y WinRAR.
3. BZ/BZ2
BZ es muy similar a GZ pero utiliza el algoritmo de transformación de Burrows-Wheelers, lo que da como resultado un poco más de compresión y un tamaño de archivo más pequeño. Aunque la compresión es lenta, la descompresión es bastante rápida. La mayoría del software compatible con GZ también es compatible con BZ.
4. Cremallera
Zip es probablemente el formato de archivo más conocido y utilizado. Zip utiliza el algoritmo Deflate y admite la compresión sin pérdidas. También es compatible con el cifrado AES y DES. La mayoría de los sistemas operativos modernos vienen con soporte incorporado para el formato Zip, por lo que no necesita un software separado para archivar y desarchivar archivos Zip.
5. 7Z
El formato de archivo 7Z se introdujo con una utilidad gratuita y de código abierto llamada 7-Zip. Es el formato general de compresión y archivo más avanzado que admite la mayoría de los algoritmos de compresión y cifrado de datos, incluidos los que hemos discutido anteriormente. El formato 7Z comprime los archivos más que cualquier otro formato, pero su procesamiento es relativamente más lento. Otra limitación es que el software 7-Zip solo está disponible para Windows. No hay soporte visual para Mac o Linux. 7Z también admite el archivo de varias partes.
6.RAR
RAR es un formato de archivo patentado. Si bien otras utilidades como 7-Zip y WinZip pueden leerlo y extraerlo, solo se puede crear con la utilidad WinRAR. RAR era el formato más popular para el archivo de varias partes antes del lanzamiento de 7Z. Ahora 7Z puede hacer la misma tarea gratis que RAR haciendo que sus usuarios paguen por el software WinRAR. RAR admite el cifrado AES.
Otros formatos de compresión y archivo
Estos son algunos de los formatos relativamente menos conocidos:
XZ es un formato de compresión de datos sin pérdidas que utiliza el algoritmo de compresión LZMA2. Se puede pensar como una versión simplificada de 7Z.
LHA, anteriormente conocido como LHarc, se utiliza principalmente para comprimir archivos de instalación y juegos (principalmente utilizados en Japón). Curiosamente, la versión japonesa de Windows 7 viene con soporte integrado para archivos LHA.
AS es un formato de archivo de archivo de compresión de datos patentado que era un competidor del formato RAR en los primeros días de 2000.
Llenalo se lanzó principalmente para Mac, pero posteriormente se lanzaron versiones para Windows, Linux y Solaris. Este es un formato de compresión patentado utilizado por las utilidades StuffIt.
Conclusión
En Linux, el formato más utilizado es gz (o tar.gz), seguido de bz, mientras que en Windows o Mac, el formato más utilizado es Zip. Para compatibilidad multiplataforma, el formato Zip es el indicado. Si desea funciones como seguridad, alta compresión y archivo de varias partes, elija el formato 7Z. RAR es similar a 7Z excepto que viene con una etiqueta de precio. Evítalo tanto como sea posible.
¿Qué formato de archivo y utilidad utiliza para la compresión?
Credito de imagen: Primavera, Réplica del dispositivo de cifrado M-94