Cómo encontrar tipos de archivos comprimidos en Ubuntu Linux

Cómo encontrar tipos de archivos comprimidos en Ubuntu Linux

How Find Compressed Archive Types Ubuntu Linux

A veces, cuando intenta extraer un .tar.gz, .tar.xz, .tar.bz2 o incluso un archivo zip normal, encontrará que obtiene un error como xz: (stdin): formato de archivo no reconocido que indica que el sistema operativo no puede extraerlo. Ubuntu y otras distribuciones de Linux derivadas de Debian proporcionan una utilidad de archivo que le permitirá saber si lo que está intentando extraer tiene el nombre correcto. Ocasionalmente, es posible que un archivo comprimido tenga un nombre incorrecto o, a veces, debido a un error de un navegador web, algo que no sea un archivo comprimido podría tener ese nombre. Si bien Linux y muchos otros sistemas operativos basados ​​en Unix no dependen completamente de las extensiones de archivo en la medida en que lo hacen DOS y Windows, aún las usan para identificar archivos comprimidos.



Si la utilidad de archivo le dice que el archivo es del tipo incorrecto, simplemente necesita cambiar el nombre a la extensión correcta y luego intentar extraerlo nuevamente. Si no es un archivo, la utilidad de archivo seguirá funcionando para identificar el tipo correcto. Lo más probable es que descubra que el archivo es un archivo HTML identificado por error como un archivo, pero siempre debe tener cuidado al extraer archivos que descarga de Internet de todos modos. Los delincuentes digitales a veces modifican los archivos para que aparezcan como archivos con el fin de causar problemas a los usuarios, por lo que los consejos de la utilidad de archivos deben tomarse en serio.



Identificación de tipos de archivos independientemente de las extensiones

Naturalmente, siempre se sugiere encarecidamente que realice un análisis de malware en los archivos antes de extraerlos, pero suponiendo que no haya aparecido nada, es posible que vea varios tipos de mensajes de error. Además de los de xz o gunzip, también puede ver varios mensajes de error del programa tar. Si recibe errores que leen tar: el niño devolvió el estado 1 o tar: el error no se puede recuperar: saliendo ahora, es posible que esté extrayendo algo que no debería extraerse o, al menos, no de la manera que ordenó a tar. hazlo. Es posible que haya probado unxz u otros programas, que continúan obteniendo los mismos errores con el tiempo.

Desde el indicador de CLI con el que ha estado trabajando, intente archivar theFileName.tar.xz, reemplazando theFileName.tar.xz con el nombre del archivo con el que está trabajando. La extensión actualmente puede ser .tar.gz, .tar.bz2, .txz, .tgz o varias otras permutaciones. El comando de archivo calcula una suma de los primeros bytes del archivo, que a veces se denomina número mágico. Esta llamada prueba mágica se evalúa luego en una tabla, que a su vez se asigna a muchos tipos diferentes de archivos. Si el archivo encuentra que en realidad es un archivo de texto de algún tipo, informará en qué codificación está el texto.



Por ejemplo, podría file.tar.xz: documento HTML, texto Unicode UTF-8, con líneas muy largas, lo que indica que su navegador descargó una página web en lugar de un archivo. Un comando wget defectuoso también podría hacer que esto sea una realidad. No hay forma de que ninguna extracción saque ningún archivo de un archivo como ese. Si afirma que se trata de un archivo comprimido .xz con el formato correcto, es posible que desee probar apt list xz-utils para asegurarse de que los paquetes xz estén instalados, aunque tanto Ubuntu como Debian generalmente requieren su instalación de todos modos para fines de administración de paquetes. . Lo mismo ocurre con todos los diversos derivados de Ubuntu, como Lubuntu y Kubuntu.

La utilidad de archivo a veces simplemente devolverá datos sin ninguna otra información. Si bien esto puede ser exacto para algunos archivos creados por juegos en línea o editores binarios, no es algo que deba ver en un archivo y podría indicar daños en el archivo. El tipo de datos también podría corresponder teóricamente a algunos de los formatos propietarios que usaron Classic Macintosh y OS X posterior, que normalmente no deberían extraerse en Linux de todos modos. Si el archivo le dice que un archivo comprimido es en realidad un ejecutable de Windows o MS-DOS, es muy posible que sea una pieza de malware diseñado para atacar PC con Windows.

Es posible que vea algo como FileName.zip: datos de archivo ZIP, al menos V2.0 para extraer como tipo de retorno. Puede cambiar el nombre del archivo de .tar.xz a .zip para extraerlo correctamente en ese caso. También puede cambiarle el nombre .tar.bz2 o .tar.gz dependiendo de la salida que le dio la utilidad de archivo. Una vez que hayas hecho esto, puedes extraerlos como de costumbre, incluso si no pudiste hacerlo antes. Si tiene un archivo ZIP o algo similar, entonces podría usar el archivo -z theFileName.zip para ver no solo una lista de lo que hay en el archivo, sino también lo que la utilidad de archivo cree que es cada tipo.



Devolver un valor de ejecutable Intel 80386 PE32 cuando se ejecuta la utilidad de archivo en un archivo con la opción -z podría indicar que hay legítimamente un programa de Windows en su interior. Si este es el caso, y se ha asegurado de ejecutar varios análisis de malware en él, es posible que pueda ejecutarlo con la capa de compatibilidad de Wine después de extraerlo. Algunas de las líneas que devuelve el archivo podrían ser teóricamente bastante largas, por lo que es posible que desee presionar F11 dentro de la ventana de su terminal. Esto lo hace lo suficientemente grande como para cubrir todo el escritorio, sin tener que recurrir a una consola virtual de Linux.

También puede intentar usar el modificador –apple, que le proporciona los identificadores de archivo antiguos de Apple que puede necesitar si intenta compartir archivos con usuarios de otros sistemas operativos.

Tenga en cuenta que el archivo identificará algunos tipos de archivos como texto ASCII o Unicode, incluso cuando un usuario no crea que se clasificarían como tales. Un archivo .csv es un archivo de hoja de cálculo especial asignado a ciertos caracteres de texto. El comando de archivo llamará a un .csv creado en una máquina Windows ASCII con terminadores CRLF, y si crea uno en su propia máquina Ubuntu, podría llamarlo texto Unicode. Esto no es un error que indica que la extensión de un archivo es incorrecta, sino solo una peculiaridad de la forma en que clasifica los archivos.

4 minutos de lectura