2.3. Metadatos (Metadata)
Se utiliza para añadir información sobre la página. Esta información o metadatos no se visualiza en la página, pero es de suma importacia para los buscadores y para los navegadores. Los buscadores consultan la información de la etiqueta
<meta> de las páginas, buscando coincidencias con lo que el usuario pretende encontrar. No tiene etiqueta de cierre pero se puede poner al final el cierre
/>.
Va entre las etiquetas:
<head></head>
Es la etiqueta:
<meta> o <meta />
Ejemplo:
<head>
<meta name="Author" content"ParriOro">
<meta name="Author" content"ParriOro" />
</head>
2.3.1. Atributos
Van dentro de la etiqueta:
<meta>
2.3.1.1. name y content
name: Indica el tipo de información.
content: Indica el valor de dicha información.
Para indicar el tipo de información podemos utilizar cualquier palabra que deseemos, como puede ser
Autor,
Palabras clave,
Descripción, etc. Pero debido a que la mayoría de buscadores están en inglés, es preferible que el tipo de información se especifique en inglés,
Author,
keywords,
description.
Los valores más habituales del atributo
name son:
- author: Autor de la página. Es la persona con la que querríamos ponernos en contacto por algún asunto relacionado con el documento.
- classification: Palabras para clasificar la página en los buscadores.
- copyright: Información sobre el copyright del documento.
- description: Descripción del contenido de la página. Algunos motores de búsqueda incluyen esta información junto con los resultados de la búsqueda, por lo que para que sea realmente útil debería contener la mejor descripción posible del documento.
- distribution: Este meta es importante. Marca la distribución que queremos que se haga de nuestra web en Internet. Si queremos que se distribuya por todo el mundo en content indicaremos global. Escribir este meta en global es lo más recomendable.
- generator: Programa o editor utilizado para crear la página.
- keywords: Palabras clave que definan la página. Palabras separadas por comas y sin espacios.
- owner: Se refiere a la persona, empresa o sociedad propietaria del sitio Web.
- progid: Especifica el tipo de documento donde se ha creado.
- rating: Se refiere a si el contenido de nuestro sitio Web es apto para todos los públicos o solo para adultos. Si la macamos como general, se indicará a los motores de búsqueda que su contenido es para todos los públicos, si la marcamos como adultos los motores de búsqueda no la ofrecerán en sus resultados cuando haya filtros para menores de edad.
- resource-type: De acuerdo al tipo de documento que sea la página, se lo indicamos al motor de búsqueda con esta etiqueta. Algunas de las posibles opciones para este atributo son: Homepage, Document, FAQ, etc.
- revisit-after: Indica al motor de búsqueda el periodo de tiempo tras el cual debe revisar nuestra página. No debe ser nunca inferior a un mes.
- robots: Controla la acción de los motores indexadores sobre el documento. En general puede tomar uno o más de los siguientes valores:
- INDEX: Los robots pueden indexar esta página.
- NOINDEX: Los robots no pueden indexar esta página.
- FOLLOW: Puede recorrerla para buscar nuevos enlaces.
- NOFOLLOW:No puede recorrerla para buscar nuevos enlaces.
- ALL: Los robots pueden indexar esta página y recorrerla para buscar nuevos enlaces. Equivale a INDEX, FOLLOW.
- NONE: Los robots no pueden indexar esta página y recorrerla para buscar nuevos enlaces. Equivale a NOINDEX, NOFOLLOW.
- Otros de su propia creación.
Ejemplo:
<meta name="author" content="ParriOro">
<meta name="copyright" content="© 2011, La Zona by ParriOro">
<meta name="description" content="Este documento trata sobre las etiquetas META">
<meta name="distribution" content="global">
<meta name="generator" content="bloc de notas">
<meta name="keywords" content="html,meta,name,atributos">
<meta name="owner" content="ParriOro">
<meta name="progid" content="txt.document">
<meta name="rating" content="general">
<meta name="resource-type" content="document">
<meta name="revisit-after" content="1 mounth">
<meta name="revisit-after" content="35 days">
<meta name="robots" content="all">
2.3.1.1.1. Dublin Core
Dublin Core es un estándar de metadatos que define un conjunto de propiedades recomendadas para descripciones bibliográficas electrónicas, y su objetivo es promover la interoperabilidad entre modelos descriptivos dispares. Estas propiedades incluyen entre otras: título, autor, descripción, tema, editor, tipo de recurso, fecha de publicación, idioma, formato, documentos relacionados, derechos de autor, etc.
Ejemplo:
<meta name="DC.Title" content="HTML - Metadatos">
<meta name="DC.Creator" content="ParriOro">
<meta name="DC.Subject" content="Metadatos">
<meta name="DC.Description" content="Este documento trata sobre las etiquetas META">
<meta name="DC.Publisher" content="lazonahtml.webcindario.com">
<meta name="DC.Date" content="2011-04-12">
<meta name="DC.Type" scheme="DCMIType" content="Text">
<meta name="DC.Format.Medium" content="text/html">
<meta name="DC.Relation.isPartOf" content="http://www.lazonahtml.webcindario.com/">
<meta name="DC.Identifier" content="http://html.lazonahtml.webcindario.com/carpeta de la página en la que está esta página">
<meta name="DC.Language" content="es">
<meta name="DC.Rights" content="© 2011, La Zona by ParriOro.">
2.3.1.2. http-equiv y content
Crean una cabecera de respuesta HTTP que transmite información o instrucciones al navegador sobre las acciones que este debe tomar con respecto a la página. Obtiene información sobre los encabezados del mensaje de respuesta HTTP.
- allow:
- cache-control (Explorer) o pragma (Netscape): Es una manera de controlar la caché del explorador (memoria donde se guardan las páginas que hemos visitado en la red). Esta etiqueta puede tener dos valores:
- cache: Utiliza la memoria caché para guardar la página, con lo cual se cargará mas rápido en el ordenador, pero puede ser un punto en contra a la hora de actualizar la página, puesto que los usuarios no verán los nuevos resultados.
- no-cache: No utiliza la caché del explorador para guardar la página.
- content-encoding: Indica la codificación de los datos devueltos, por lo general el tipo de compresión.
- content-language: Especifica el lenguaje natural del documento. Utilizado por los motores de búsqueda para categorizar páginas por idioma.
- content-length:
- content-script-type: Selecciona el lenguaje de script predeterminado para el elemento script.
- text/javascript.
- text/VBscript.
- content-style-type: Especifica el lenguaje de hojas de estilo por defecto de un documento. Para especificar que el valor por defecto es CSS: content="text/css".
- content-type: Informa del tipo MIME del documento que en las páginas web es siempre text/html pero esto es algo que el servidor ya envía por defecto. Pero con esto podemos enviar la codificación de caracteres que estamos usando mediante el atributo charset. Para el caso del español, el juego de carácteres es el charset="iso-8859-1".
- date, expires y last-modified:
- date: Especifica la fecha y hora en que se creó la página.
- expires: Fecha de expiración (caducidad) de un documento.
- last-modified: Especifica la fecha de la última modificación.
- imagetoolbar: En algunas versiones de Internet Explorer, cuando se pasaba el ratón por encima de una imagen aparecía una barra de herramientas de imagen. Esto lo anula.
- location: Redirige al visitante a otra ubicación.
- page-enter y page-exit: Transiciones propiedad de Microsoft que sólo funciona en Internet Explorer.
- content="revealtrans(duration=segundos,transition=num)" donde segundos es el tiempo que la transición debe tomar, y num es un entero entre 0 y 23, en correlación con un tipo específico de transición. Hay 23 transiciones, de 0 a 22. Una transición con un valor de 23 permite a Internet Explorer seleccionar al azar a partir de las 23 transiciones disponibles.
- content="blendTrans(duration=segundos)" es otro valor.
- PICS-Label: Se usa para facilitar la labor de filtrado de la página con arreglo a su contenido, advirtiendo de que puede tener, por ejemplo, contenido sexual, violencia o lenguaje ofensivo. Generador de PICS-Label.
- refresh: Para refrescar una página o refrescar y enviar a otra dirección.
- reply-to: Para indicar una dirección de correo para contactar con el administrador del sitio.
- set-cookie: Es una de las maneras mas fáciles de introducir una cookie en el explorador del usuario que visita la página. Para que la cookie sea guardada en el disco duro del usuario que visita la web, debe especificarse una fecha de expiración de esta, en caso contrario la cookie se eliminará al acabar la sesión actual.
- window-target: Especifica el nombre de la ventana en la cual se debe visualizar la pagina web. Es muy útil para evitar que nuestra página sea vista en el marco de otra página web ajena a la nuestra, puesto que con el parámetro _top elimina todos los marcos existentes en el explorador. Puede tener varios parámetros:
- _black: La página se visualiza en una ventana del explorador nueva.
- _top: La página se visualiza en la ventana completa del explorador, eliminando los marcos que existan en la ventana del explorador.
- _self: La página se visualiza en el mismo marco desde el cual se originó el hipervínculo.
- WWW-Authenticate: Es un método para proporcionar la autenticación de acceso básico, pero proporciona autenticación de una manera visible, no se recomienda por razones de seguridad.
Ejemplo:
<meta http-equiv="Allow" content="">
<meta http-equiv="cache-control" content="no-cache">
<meta http-equiv="pragma" content="no-cache">
<meta http-equiv="Content-Encoding" content="gzip">
<meta http-equiv="Content-Language" content="es-ES">
<meta http-equiv="Content-Length" content="">
<meta http-equiv="Content-Script-Type" content="text/javascript">
<meta http-equiv="Content-Style-Type" content="text/css">
<meta http-equiv="Content-Type" content="text/html" charset="iso-8859-1">
<meta http-equiv="Date" content="Mon, 17 Oct 2011 09:05:14 GMT">
<meta http-equiv="Expires" content="Mon, 17 Oct 2011 09:21:56 GMT">
<meta http-equiv="Last-Modified" content="Mon, 17 Oct 2011 09:05:14 GMT">
<meta http-equiv="imagetoolbar" content="no">
<meta http-equiv="Location" content="URL=http://lazonahtml.webcindario.com/index.html">
<meta http-equiv="page-enter" content="revealtrans(duration=5,transition=23)">
<meta http-equiv="page-exit" content="revealtrans(duration=5,transition=23)">
<meta http-equiv="page-enter" content="blendTrans(duration=5)">
<meta http-equiv="page-exit" content="blendTrans(duration=5)">
<meta http-equiv="PICS-Label" content="(PICS-1.1
"http://vancouver-webpages.com/VWP1.0/" l gen true comment "VWP1.0" by "candilejas74@yahoo.es"
on "2011.10.17T11:09-0700" for "http://lazonahtml.webcindario.com/" r (Gam -1 V 0 Env 0 SF 0 Com 0 Can 0 Edu -2 S 0 P 0 Tol -1 MC 0 ))">
<meta http-equiv="Refresh" content="30"> (Refresca la página cada 30 seg.)
<meta http-equiv="Refresh" content="5; URL=http://www.lazonahtml.webcindario.com/index.html"> (5 seg. y redirecciona)
<meta http-equiv="Reply-To" content="candilejas74@yahoo.es">
<meta http-equiv="Set-Cookie" content="cookievalue=xxx; expires=Friday, 21-Oct-11 14:18:41 GMT; path=/">
<meta http-equiv="Window-target" content="_top">
<meta http-equiv="WWW-Authenticate" content="">
2.3.1.3. scheme
No suele utilizarse, aunque permite proporcionar información de contexto para que el navegador interprete correctamente el valor del metadato. En el siguiente ejemplo, el atributo
scheme indica al navegador que el valor del metadato hace referencia al código ISBN.
Ejemplo:
<meta scheme="ISBN" name="identificador" content="789-1392349610">
Especifica el formato o URL del valor dado en el atributo
content. Nombra un esquema que será usado para interpretar el valor de la propiedad.
- formato: El elemento <meta name> está principalmente destinado a aplicaciones específicas para leer documentos, pues los navegadores hacen un uso parcial del mismo. En este ejemplo hemos incluido un valor personal para expresar una fecha con <meta scheme="dd-mm-aa" name="fecha" content="07-10-11" /> y un destino hipotético para el perfil en <head profile="formatos-fechas.txt">, donde se supone que el esquema dd-mm-aa es indicativo de "día, mes y año". Sin embargo como hemos dicho, los navegadores no saben que hacer con esto pues iría destinado a una aplicación específica que supiera tratarlos. Lo único que nos ofrece Firefox es un resumen de los metadatos en su opción del menú ver información de la página, donde se relacionan los metadatos usados.
Ejemplo:
<html>
<head profile="formatos-fechas.txt">
<title>HTML Básico</title>
<meta scheme="dd-mm-aa" name="fecha" content="07-10-11" />
</head>
<body>
Etiquetas y contenidos del cuerpo. Parte del documento que será mostrada por el navegador: Texto e imágenes.
</body>
</html>
- URL:
Ejemplo:
<html>
<head profile="URL.txt">
<title>HTML Básico</title>
<meta scheme="URL" name="Enlace" content="http://lazonahtml.webcindario.com/index.html" />
</head>
<body>
Etiquetas y contenidos del cuerpo. Parte del documento que será mostrada por el navegador: Texto e imágenes.
</body>
</html>
2.3.1.4. dir
Especifica la dirección del texto en el atributo
content. El valor
ltr va de izquierda a derecha (
left
to
right). El valor
rtl va derecha a izquierda (
right
to
left). El español se escribe de izquierda a derecha mientras que el árabe o hebreo van de derecha a izquierda.
Ejemplo:
<html>
<head>
<title>HTML Básico</title>
<meta name="description" content="Este documento trata sobre las etiquetas META" dir="ltr">
</head>
<body>
Etiquetas y contenidos del cuerpo. Parte del documento que será mostrada por el navegador: Texto e imágenes.
</body>
</html>
2.3.1.5. lang
Especifica el idioma base de los valores de los atributos y del texto contenido en un elemento. El atributo
lang es útil para:
- Ayudar a los motores de búsqueda.
- Ayudar a los sintetizadores de voz.
- Ayudar al agente de usuario a hacer decisiones sobre separación de palabras, ligaduras, y espaciado.
- Ayudar a los verificadores de ortografía y gramática.
Ejemplo:
<html>
<head>
<title>HTML Básico</title>
<meta name="description" content="Este documento trata sobre las etiquetas META" lang="es-ES">
</head>
<body>
Etiquetas y contenidos del cuerpo. Parte del documento que será mostrada por el navegador: Texto e imágenes.
</body>
</html>