[Indice]


Estructura de un documento HTML

Los documentos escritos en HTML estan estructurados en dos partes diferenciadas: la HEAD (cabecera) y el BODY (cuerpo).

Ejemplo de documento

Si escribes:

<HTML>
<HEAD>
<TITLE> Documento de prueba </TITLE>
</HEAD>

<!-- Esto es un comentario-->

<BODY>

<H1> Esto es una "demo" de documento HTML </H1>

Esto es el más sencillo de los documentos HTML.

</BODY>
</HTML>

El elemento <HTML> </HTML> no es obligatorio. Solo sirve como identificación del tipo de contenido del fichero para ciertos programas que hacen cambios masivos en muchas páginas a la vez.

Puedes ver su aspecto real pulsando aquí.

Para escribir comentarios en la página (que sólo se ven en el texto fuente, pero no en el visualizador) se utilizará el elemento <!--    -->    cuidado el que no se vea de forma normal en el navegador, no significa que no pueda verse el código fuente. Nunca escribas comentarios con claves de acceso o datos confidenciales.


Esquema de tipos de un documento HTML

Cuando un visualizador recibe un fichero, antes de mostrarlo necesita saber el tipo de contenido que éste tiene, a fin de procesarlo adecuadamente. No es lo mismo recibir un documento de texto que una fotografía en formato GIF, o un vídeo en formato MPG, o si lo que estamos intentando es transferir un fichero.
En cada caso, el visualizador pondrá en juego distintas habilidades, de las muchas que posee.
Si el fichero procede de un servidor http remoto, (es decir un servidor WWW; http es el nombre del servicio invocado), éste se encargará de decirle al visualizador cuanto necesite saber, pero si lo que hay que procesar es un fichero local, la única forma de saberlo es por la extensión del fichero.

La extensión de un fichero son las tres o cuatro letras (depende del sistema operativo con el que se trabaje) que hay después del nombre del fichero y que están separadas del mismo por un punto.

Por ejemplo, esta página se llama estruc.htm. Las tres letras que hay después del punto (htm) son la extensión del fichero. Las otras, las que están delante del punto, son el nombre del fichero.

Hay que tener presente que las extensiones de 4 o más letras son propias de sistemas operativos como Unix, Macintosh o Windows95 y las de 3 o menos del DOS.
Estas son algunas de las extensiones stándard más comunes y sus contenidos:

.html o .htm
Documento HTML. Contine texto e instrucciones HTML que serán interpretadas.
.text o .txt
Contiene texto plano. El visualizador presentará todo el fichero como si fuera un único bloque de texto y no interpretará ninguna instrucción HTML que pudiera llevar. Esto lo hará con cualquier fichero que lleve una extensión desconocida o simplemente no lleve ninguna.
.gif
Contiene un fichero de imagen en formato GIF.
.xbm
Contiene un fichero de imagen en formato X-Bitmap (blanco y negro).
.xpm
Contiene un fichero de imagen en formato X-Pixmap (color).
.jpeg o .jpg
Contiene un fichero de imagen en formato codificado jpeg.
.mpeg o .mpg
Contiene un fichero de imagen de video o cine (en movimiento).
.au
Contiene un fichero de audio (sonido) codificado en aiff-encoded.
.mid
Contiene un fichero de audio (sonido) generado con secuenciadores midi típicos de Windows.
.avi
Contiene un fichero con video y sonido típico de Windows95.
.exe
Contiene un fichero binario ejecutable en DOS.
.hqx
Contiene un fichero binario ejecutable en Macintosh.
.Z o .zip
Contiene un (o varios) fichero/s comprimido/s de cualquier clase. Para poder utilizarlo hay que indicarle al visualizador una herramienta de compresión-descompresión.
En el entorno WWW se utilizan los MIME types (Multipurpose Internet Mail Extension) para definir el tipo de un fichero transferido. El visualizador determina desde el MIME type cómo hay que tratar cada fichero.

Los visualizadores tienen una configuración de los mapas de tipos aceptables, e instrucciones de cómo proceder en cada caso. Algunos tipos son tratados directamente por el propio visualizador (p.ej.: htm, gif, txt) mientras que para otros necesitan de una herramienta auxiliar adecuada, que hay que indicar al visualizador, para que sea llamada en el momento preciso (p.ej.: zip, mpg, au).


Ahora que ya sabes qué son las extensiones de fichero, es el momento de aclarar una cuestión importante:

Los documentos HTML los puedes escribir con lo que quieras... Siempre que los salves en modo Solo Texto. Es decir, que si utilizas, por ejemplo, Word de Windows o de MAC, por defecto estos programas salvan en formato Word. Y aunque luego los renombres como documentos .htm o .html, el formato interno sigue siendo Word.

Tampoco vale dejarlos con la extensión .txt que les dejan la mayoría de editores al salvarlos en modo Solo Texto. No serían interpretados correctamente. Por lo tanto si tienen extensión .txt (y por supuesto son .txt), entonces puedes renombrarlos a .htm, o bien en el momento de guardarlos en formato Solo Texto no dejar la extensión por defecto .txt y darle ya directamente la extensión .htm.
Algunos procesadores de texto, ya incluyen entre sus tipos el .htm. Si es así lo que hacen es eliminar la codificación propia, y convertirla a elementos de HTML. Por ejemplo, si tienes un texto en itálica, automáticamente es convertido al elemento <I>, etc..


[Indice]