ISO

Explore

SA3

Introducción

Introducción al sistema de archivos

Unidades de almacenamiento

La información se guarda dentro de soportes o unidades de almacenamiento (Discos duros, USBs, CDs, etc.)

Esta información tiene forma de archivos o ficheros

La forma en que se almacena la información la determina el sistema de ficheros.

El sistema de ficheros establece para cada fichero:

ESTRUCTURA

NOMBRE

FORMA DE ACCESO

PROTECCIÓN

Las unidades de almacenamiento

Guardan la información con la que trabaja el ordenador

Son dispositivos no volátiles (no se borra su contenido cuando deja de recibir electricidad)

Estructura física disco duro HD

⁠

La información se almacena en el soporte. En el caso de los discos dicho soporte es dividido lógicamente en sectores de igual tamaño al realizar el formateo del mismo de bajo nivel (ya está hecho cuando lo compramos). Las distintas partes que forman el soporte son:

Platos (A): cada uno de los discos unidos por su eje que forman normalmente un disco duro

Caras: cada una de las caras de cada plato (la superior y la inferior

Cabezas (C): el elemento que lee o escribe en el disco. Hay un cabezal de lectura/escritura para cada cara

Brazo (B): dispositivo al que van unidas cada una de las cabezas de lectura/escritura

Pistas (E): son círculos concéntricos en los cuales se divide cada cara.

Cilindro (D): se llama así a la misma pista de todas las caras (formado por todas las pistas accesibles en una posición de los cabezales)

Sector (F): cada una de las divisiones de una pista. Es la unidad mínima que se puede leer o escribir de un disco

Clúster: agrupación fija de sectores (se determina al dar formato al disco. Es la unidad mínima que el sistema operativo lee o escribe en cada operación.

⁠

Estructura física disco duro SSD

Se eliminan las partes móviles de un disco duro mecánico, aumentando considerablemente la velocidad.

Se utilizan memorias Flash con puertas lógicas NAND, que son no volátiles

Estas puertas NAND están fabricadas mediante transistores de puerta flotante que es el elemento en donde se almacenan los bits. Para el caso de las memorias RAM estos transistores necesitan de una alimentación continua para mantener su estado y en las memorias flash no. Cuando un transistor de puerta flotante está cargado tiene en su interior un 0, y cuando está descargado tiene un 1.

Los chips de memoria Flash con puertas NAND se organizan en forma de matriz.

⁠

Estructura lógica

Se abstrae la estructura física del disco para crear una estructura lógica, en la que el espacio de almacenamiento se ve como una serie de sectores contiguos.

Por ejemplo, en un disco particionado con tabla de particiones Ms-DOS, el sector de arranque (MBR o Master Boot Record) se localiza siempre en el primer sector del disco (cabeza 0, cilindro 0, sector 1). En él se almacena la tabla de particiones y un pequeño programa (master boot code) encargado de leer la tabla de particiones y ejecutar el programa del sector de arranque de la partición activa.

⁠

Cada partición se comporta como si fuera un disco independiente. La estructura interna de cada partición dependerá del sistema de archivos que utilice. Se llama sector de arranque de la partición al primer sector de la misma (sectores azules de la imagen anterior) y, si la partición tiene instalado un sistema operativo, en él se encontrará el programa que inicia el arranque del sistema.

⁠

Otra forma de particionar un disco duro es mediante la tabla de particiones GUID (GPT). Es parte del estándar Extensible Firmware Interface (EFI) propuesto por Intel para reemplazar el viejo BIOS del PC y sustituye al particionado Ms-DOS o Master Boot Record (MBR) usado con el BIOS.

En un disco formateado con la tabla Ms-DOS el MBR comienza con el código de arranque maestro (Master Boot Code), que contiene un programa ejecutable que identifica la partición activa e inicia el proceso de arranque del sistema operativo. Sin embargo, la GPT se basa en las capacidades extendidas del EFI para estos procesos. Aunque el disco comienza también con el sector MBR (llamado MBR heredado, sólo por protección y compatibilidad con el viejo esquema BIOS PC), la GPT propiamente dicha comienza con la cabecera de la tabla de particiones.

GPT usa un moderno modo de direccionamiento lógico (LBA, Logical Block Addressing) en lugar del modelo cilindro-cabeza-sector (CHS) usado con el MBR para identificar cada sector del disco. La información de MBR heredado está almacenada en el LBA 0, la cabecera GPT está en el LBA 1, y la tabla de particiones en sí en los bloques sucesivos. En los sistemas operativos Windows de 64-bits, 16.384 bytes, o lo que es lo mismo, 32 sectores, están reservados para la GPT, dejando el bloque LBA 34 como el primer sector usable del disco.

GPT proporciona asimismo redundancia. La cabecera GPT y la tabla de particiones están escritas tanto al principio como al final del disco.

⁠

Almacenamiento de la información

La información se guarda en los dispositivos de almacenamiento mediante archivos, que son grupos de informaciones relacionadas.

Archivos

Cada sistema operativo utiliza el sistema de archivos de una partición para gestionar como se guardan los archivos en la misma y sus metadatos, como:

Nombre

Tamaño

Tipo de archivo

Fecha

Ubicación física

Etc.

Un archivo se identifica de forma unívoca mediante su nombre y la ruta de acceso.

El aspecto y formato del nombre depende del sistema operativo y del sistema de archivos que utilizamos.

Algunos sistemas permiten nombres con espacios, caracteres especiales, distinguen entre mayúsculas y minúsculas, etc.

Una parte importante del nombre de un archivo es su extensión, que se ubica al final del mismo detrás de un punto (normalmente son 3 caracteres, aunque puede variar)

En MS Windows la extensión permite conocer el tipo de información que contiene.

En GNU/Linux esta información se guarda en meta-datos, aunque se suele utilizar la extensión para aportar información al usuario.

Directorios

Tipo de archivo especial que permite organizar los ficheros.

Puede contener ficheros y/o otros directorios.

De este modo los archivos y directorios constituyen una estructura jerárquica en forma de árbol: cada medio tiene un directorio principal llamado directorio raíz dentro del cual se encuentran archivos y otros subdirectorios que contienen más archivos y subdirectorios.

Se denomina directorio padre de un directorio al directorio que contiene a ese directorio.

Directorio raíz

Es el primer directorio o carpeta en una jerarquía. Contiene todos los subdirectorios de la jerarquía.

En sistemas tipo Unix, se identifica con el carácter /. Todos los accesos al sistema de ficheros, incluyendo los otros discos y particiones, se encuentran en la jerarquía dentro del directorio raíz.

En los sistemas Windows cada partición tiene un directorio raíz individual (nombrado letra:\, por ejemplo para una determinada partición C su directorio raíz se llama C:**) y no hay un directorio raíz común que las contenga a todas ellas.

⁠

Rutas

La ubicación de un archivo se indica con una cadena de texto llamada “ruta” (path). La ruta también sirve para identificar al archivo. Puede haber dos archivos con el mismo nombre en distintas rutas. La nomenclatura de rutas varía ligeramente dependiendo del sistema.

Aunque de forma general, una ruta viene dada por una sucesión de nombres de directorios y subdirectorios, ordenados jerárquicamente de izquierda a derecha y separados por algún carácter especial que suele ser una barra (‘/’) o barra invertida (‘') y acaba en el nombre de un archivo o directorio presente en la última rama de directorios especificada.

Ejemplo de ruta en Unix:

/home/usuario/documentos/documento.txt

/ representa el directorio raíz

home/usuario/música es la ruta

documento.txt es el nombre del archivo

Ejemplo de ruta en Windows:

C:\Usuarios\usuario\Documentos\documento.txt

C: es la unidad de almacenamiento

\ representa el directorio raíz de la unidad C:

Usuarios\usuario\Documentos es la ruta

documento es el nombre del archivo

.txt es la extensión

Rutas absolutas y relativas

Siempre hay 2 formas de identificar un fichero:

Utilizando su ruta absoluta: es la que empieza en el directorio raíz y llega hasta el fichero. Los ejemplos que hemos visto anteriormente usan rutas absolutas.

Utilizando rutas relativas: en lugar de empezar la ruta por el directorio raíz se empieza desde el directorio activo (directorio en el que nos encontramos).

Ejemplo de ruta absoluta

/home/usuario/documentos/documento.txt

Ejemplo de rutas relativas

Si el directorio activo es /home/usuario/documentos/, la ruta del fichero documento.txt sería:

documentos/documento.txt

(o también podría escribirse ./documento.txt).

Si el directorio activo es /home/usuario/, la ruta del fichero documento.txt sería:

documentos/documento.txt

Si el directorio activo es /home/usuario/música/, la ruta del fichero documento.txt sería:

../../documentos/documento.txt

NOTA: la barra final de la ruta de un directorio puede omitirse, por lo que es lo mismo /home/usuario/ que /home/usuario

Sistemas de archivos

Establecen la estructura, nombre, forma de acceso, uso y protección que tendrá cada archivo almacenado.

El tipo de sistema de archivos de un dispositivo se determina al darle formato.

Además de alojar los datos de los archivos, el sistema de archivo también almacena y manipula información muy importante sobre los archivos y el propio sistema de archivo (fecha y hora, propiedad, permisos de acceso, tamaño de los archivos, localización del almacenaje en el disco, etc).

Esta información constituye lo que comúnmente denominamos metadatos que son atributos asociados a un fichero pero que no forman parte de él.

La mayoría de los sistemas operativos pueden trabajar con varios sistemas de ficheros.

Los sistemas de archivos proveen métodos para crear, copiar y eliminar tanto archivos como directorios así como para garantizar el acceso seguro a los archivos.

Cuando elegimos un sistema de archivos para formatear un medio debemos tener en cuenta:

La medida máxima que ese sistema permite para un fichero.

Capacidad máxima del sistema de ficheros (es decir, medida máxima de cada partición)

Cómo gestiona los permisos de ficheros y directorios.

Cómo evitar la fragmentación.

Si tiene Journaling (recuperación después de un apagado brusco)

Si permiten enlaces, tanto simbólicos como duros.

Si proporciona soporte para ficheros dispersos.

Si permite el crecimiento del sistema de ficheros nativo.

Fragmentación del disco

Al irse escribiendo y borrando archivos continuamente en el disco duro, estos tienden a no quedar en áreas contiguas.

Así los diferentes clústeres que forman el archivo quedan repartidos por todo el disco, y se dice entonces que el archivo está “fragmentado”.

Al tener los archivos esparcidos por el disco, se vuelve ineficiente el acceso a ellos en discos HD ya que el cabezal tiene que irse moviendo por el disco para acceder a las diferentes pistas donde se encuentran las partes del fichero.

Los sistemas de archivos de Windows tienen mayor tendencia a la fragmentación.

⁠

Journaling

El sistema de archivos procura trabajar de forma asíncrona para evitar cuellos de botella.

Si el ordenador se apaga de forma brusca, pueden ocurrir varias cosas:

Si ya se ha salvado el archivo, al reiniciarse se puede continuar trabajando en él.

Si todavía no se ha salvado el archivo, probablemente se pierdan los datos recientes.

Si el archivo está siendo escrito en disco, tenemos un archivo parcialmente nuevo y no se podrá abrir porque el formato interno de los datos es inconsistente.

Si se ha escrito el archivo pero todavía no los metadatos será el peor escenario puesto que tendremos un sistema de archivos corrupto, pudiendo perder muchos datos.

Los sistema de archivo más modernos escriben primero en un área llamada journal o log antes de escribir los datos en su localización final. Una vez escritas en su posición del disco se borran del log. De este modo, cuando el sistema arranca tras un apagado brusco en mitad de una transacción, simplemente se debe rehacer lo escrito en el journal.

Principales sistemas de archivo

FAT (y derivados)

El sistema de archivos FAT (File Allocation Table) es el sistema de archivos que se utilizaba en los primeros PC’s. En la actualidad suele usarse normalmente en las unidades USB. Sus principales inconvenientes son:

Tamaño máximo del sistema de archivos y de un fichero de 4GB

No soporta ACLs ni ningún otro tipo de permiso

No tiene Journaling ni soporte para metadatos

FAT32

Supera algunas limitaciones de FAT:

Puede almacenar hasta 2TB

Soporte para Journaling y metadatos

También tiene un límite de tamaño de archivo individual de 4GB

exFAT

Supera las capacidades de almacenamiento de sus predecesores (sin problemas en la capacidad de almacenamiento)

NTFS (New Technology File System)

Supera las limitaciones de FAT en los sistemas Windows.

Es eficiente, robusto, admite seguridad, compresión nativa de ficheros, cifrado y journaling.

El inconveniente que plantea es que necesita para si mismo bastante espacio en disco.

APFS (Apple File System)

Es el sistema de ficheros usado por defecto por Mac OSX desde 2017 en sustitución del antiguo HFS+.

ext (Extended Filesystem)

ext fue el primer sistema de archivos diseñado específicamente para Linux

Sucedido por ext2, que todavía no implementaba Journaling

ext3 ya incorpora Journaling

en la actualidad se utiliza ext4

El sistema de ficheros tiene una tabla donde se almacenan los i-nodos, que almacenan la información del archivo:

Ruta

Tamaño

Ubicación

ZFS

Diseñado en 2005 por Sun para su sistema operativo Solaris se utiliza en la actualidad en muchos servidores y sistemas NAS. Gestiona 1 o más dispositivos y funciona sobre dispositivos lógicos.

En lugar de RAID hardware usa un RAID software llamado RAID-Z similar al RAID-5 lo que proporciona un almacenamiento rápido y muy fiable a precios económicos al usar discos “normales” sin necesidad de controladora RAID.

También incorpora la deduplicación que permite que si hay ficheros (o partes) duplicados sólo se guarde una copia de los mismos. Esto ahorra mucho espacio en disco aunque para su gestión se necesita mucha RAM (unos 2 GB de RAM por cada TB de disco).

Ceph FS

Se trata de un sistema de ficheros distribuido donde los datos se reparten por diferentes dispositivos. Podemos indicar la cantidad de copias de cada fichero que habrá entre los distintos dispositivos lo que permite una enorme seguridad y fiabilidad ya que podemos hacer que cada fichero esté en varios equipos diferentes de forma que aunque fallen algunos pueda seguir siendo accesible el fichero.

Es una opción de tener un servidor de almacenamiento muy barata y escalable ya que podemos ir añadiendo nuevos dispositivos (nuevos equipos con discos, que no tienen que ser muy caros) al sistema en cualquier momento.

Gestión de sistemas de archivo

Los sistemas operativos incluyen herramientas para gestionar los sistemas de archivos soportados por ellos.

Esta gestión incluye las operaciones más habituales:

Creación

Lectura

Actualización

Eliminación

Ejecución

Control de acceso

Operaciones sobre el propio sistema de archivos

⁠

Objetivos del sistema de archivos

Garantizar que la información del archivo sea válida.

Optimizar el acceso a los archivos.

Proveer soporte de E/S a gran variedad de dispositivos de almacenamiento.

Entregar los datos que el usuario necesita.

Eliminar o minimizar una potencial pérdida de datos.

Proveer un conjunto estándar de rutinas E/S.

Dar soporte de E/S a múltiples usuarios.

Funciones del gestor de archivos

Identificar y localizar un fichero.

Utilizar un directorio para describir la ubicación y atributos de un archivo.

Controlar el acceso de varios usuarios a los archivos.

Bloquear el uso de archivos.

Ubicar archivos en bloques libres.

Administrar el espacio libre

Gestión desde el entorno gráfico

Windows: Desde el Administrador de discos (solo lee particiones FAT o NTFS)

⁠

Se puede gestionar cada partición: crear, eliminar, redimensionar, formatear o cambiar la forma en que Windows monta la partición.

⁠

GNU/Linux: Las diferentes distribuciones y los diferentes escritorios tienen herramientas gráficas propias para gestionar los sistemas de archivo, aunque son bastante parecidos.

Utilidad ‘Discos’ de Linux Mint:

⁠

Programa ‘gparted’:

⁠

Gestión desde la terminal

Windows

No es habitual gestionar los sistemas de archivo en Windows desde la consola pero tenemos varios comandos para hacerlo:

chkdsk: permite comprobar un sistema de archivos FAT o NTFS

defrag: para desfragmentar el sistema de archivos que le indicamos

format: formatea una partición con sistema de archivos FAT o NTFS

convert: convierte una partición FAT a NTFS sin perder los datos

Algunos comandos (como chkdsk o defrag) tienen que ejecutarse desde la consola de Administrador.

Para gestionar particiones disponemos del programa diskpart (dentro del programa teclear help para obtener ayuda).

GNU/Linux

Algunos de los comandos para gestionar el sistema de archivos son:

lsblk: permite ver los diferentes discos y sus particiones

fdisk, gdisk, sfdisk, cfdisk: permite ver y modificar las particiones de un disco

fsck: permite comprobar un sistema de archivos (hay versiones para los diferentes FS)

mkfs: formatea una partición con sistema de archivos ext, FAT, NTFS, etc.

mount: monta una partición en una carpeta para poderla utilizar

df: muestra un resumen de todas las particiones montadas en el sistema

dd: permite copiar directamente al o desde el disco duro

Montaje sistema de ficheros

Para que el sistema operativo pueda utilizar un dispositivo y acceder a su sistema de archivos primeramente tiene que montarlo. Este proceso es normalmente automático y asocia ese dispositivo a una ruta (una letra en Windows o un directorio en Gnu/Linux).

MS Windows

Monta automáticamente todos los dispositivos que encuentra y tengan sistema de archivos soportado (FAT o NTFS).

A cada partición le asignará una ruta formada por una letra y dos puntos. Por ejemplo, C:

Se puede modificar la letra asignada desde el Administrador de discos.

GNU/LINUX

En este sistema sólo existe un directorio raíz por lo que cualquier dispositivo de almacenamiento que queramos utilizar ha de montarse en algún directorio.

Se montan automáticamente las particiones indicadas en el fichero de configuración /etc/fstab.

Los discos USB suelen montarse automáticamente (normalmente bajo la carpeta /media).

fstab

El archivo fstab (File Systems Table) en Linux es un archivo de configuración que define cómo se montan los sistemas de archivos en el sistema al inicio (boot). Se encuentra generalmente en /etc/fstab. Cada línea en este archivo representa un sistema de archivos que se debe montar, ya sea en el arranque o manualmente, con la información necesaria para su montaje.

Formato de una línea típica en /etc/fstab. Cada línea tiene seis campos que deben seguir el siguiente formato:

Explicación de los campos:

Dispositivo: Puede ser el identificador de la partición o dispositivo que se va a montar. Se puede usar el nombre del dispositivo en /dev, como /dev/sda1, pero también se puede usar un UUID o una etiqueta (LABEL). Ejemplo: /dev/sda1, UUID=1234-5678, LABEL=mis_datos

Punto de montaje: Es el directorio donde se montará el sistema de archivos, como /, /home, /mnt/disk, etc.

Sistema de archivos: Define el tipo de sistema de archivos, como ext4, xfs, vfat, ntfs, swap, entre otros. Ejemplo: ext4, xfs, vfat

Opciones: Son las opciones de montaje. Se pueden especificar diferentes parámetros para ajustar el comportamiento del sistema de archivos, como defaults, noatime, rw (lectura y escritura), ro (solo lectura), entre otras. Ejemplo: defaults (montaje con configuración predeterminada) noatime (no actualiza los tiempos de acceso), rw (montar como lectura y escritura)

Dump: Es un número (0 o 1) que indica si el sistema debe realizar copias de seguridad de este sistema de archivos usando dump. Un valor de 0 desactiva las copias de seguridad, mientras que 1 las habilita.

Pass: Este campo define el orden en el que fsck (el chequeo del sistema de archivos) revisa los sistemas de archivos al inicio. Un valor de 1 indica que debe ser revisado primero (generalmente la raíz /), 2 para otros sistemas de archivos, y 0 para deshabilitar la revisión.

UUID=1234-5678ASAS-ASASAS-SASSAAS / ext4 defaults 0 1

UUID=2345-6789-asasas-AWQWQE-asdaasd /home ext4 defaults 0 2

UUID=3456-7890 swap swap sw 0 0

/dev/cdrom /media/cdrom0 udf,iso9660 user,noauto 0 0

Estructura

Por defecto, cuando instalamos un sistema operativo se crean una serie de directorios donde se almacenan los ficheros del sistema, los programas instalados, etc. Veremos las diferencias entre los dos sistemas operativos con los que estamos trabajando.

MS Windows

En los sistemas Microsoft el sistema asigna una letra para cada dispositivo de almacenamiento (partición, disco o unidad extraíble). Normalmente, el sistema operativo se instalará en la unidad C:. En esta unidad se crearán los directorios por defecto del sistema operativo.

\Boot: Este directorio contiene archivos y directorios utilizados en el arranque del sistema. Normalmente se encuentra en una partición que se crea al instalar el sistema.

Want to print your doc?
This is not the way.

Try clicking the ⋯ next to your doc name or using a keyboard shortcut (

CtrlP

) instead.