http://www.it.uc3m.es/~per/doc/evi98/evi98.html
Dise帽o de un peri贸dico electr贸nico personalizado
Vicente Luque, M Carmen Fern谩ndez, Carlos Delgado
Andr茅s Mar铆n, Carlos Garc铆a
脕rea Ingenier铆a Telem谩tica
Dept. Tecnolog铆as de las Comunicaciones
Universidad Carlos III de Madrid
Avda. Universidad, 30, E-28911 Legan茅s (Madrid), Spain
http://www.it.uc3m.es/~per
Resumen
El Periotr贸nico es un proyecto de prensa electr贸nica creado para integrar en una misma aplicaci贸n todas las posibilidades que ofrece actualmente la comunicaci贸n en Internet (multimedia, audio, v铆deo, navegaci贸n hipertextual, etc). La aplicaci贸n se est谩 desarrollando intentando obtener el m谩ximo beneficio de las tecnolog铆as Web (XML, Java, JavaScript, CSS, push-pull, etc). Este documento pretende dar una visi贸n general de como estas tecnolog铆as afectan al concepto de prensa as铆 como una breve descripci贸n de su integraci贸n en la arquitectura que se est谩 desarrollando.
Introducci贸n
El World Wide Web no s贸lo ha dado a conocer Internet al mundo entero, sino que ha producido un crecimiento espectacular de su utilizaci贸n en un breve periodo de tiempo. Este novedoso medio de comunicaci贸n ha hecho posible un aumento de varios 贸rdenes de magnitud tanto en la velocidad como en la cantidad de informaci贸n disponible.
La aplicaci贸n de la tecnolog铆a del Web al periodismo tiene un inter茅s particular para nosotros. Mientras que cada vez aparecen m谩s servidores de informaci贸n especializados en temas muy concretos del conocimiento humano, se espera que sean los peri贸dicos los que faciliten por la red la informaci贸n de actualidad, aquella informaci贸n de 煤ltima hora que nos mantenga bien informados y que nos permita profundizar a煤n m谩s en su adquisici贸n si as铆 lo requerimos.
Un peri贸dico o revista electr贸nica tiene caracter铆sticas especiales que le distinguen de las ediciones impresas en papel. Los mecanismos de hipertexto permiten un acceso directo a la informaci贸n en contraposici贸n a la lectura secuencial que suele seguirse en una diario impreso. Adem谩s, los peri贸dicos electr贸nicos son instant谩neos, interactivos (al contrario de la televisi贸n), carecen de limitaciones del espacio f铆sico del papel, son actualizables continuamente, permiten la inclusi贸n de elementos multimedia (que pueden ir desde las im谩genes de una cierta calidad hasta el audio o el v铆deo), y son programables (y por tanto personalizables). Por si fuera poco, incluso tienen menores costes de producci贸n y de difusi贸n. Estas caracter铆sticas han sido tenidas muy en cuenta por numerosos grupos editoriales, tal y como lo demuestran los m谩s de 4000 peri贸dicos y revistas existentes actualmente en la red.
En este art铆culo presentamos el trabajo que estamos desarrollando en el 脕rea de Ingenier铆a Telem谩tica de la Universidad Carlos III de Madrid dentro del proyecto El Periotr贸nico: Concepci贸n y Desarrollo de un Peri贸dico Personalizable. Proyecto que llevamos a cabo conjuntamente con los departamentos de Biblioteconom铆a y Documentaci贸n y el de Humanidades y Comunicaci贸n de la Universidad Carlos III de Madrid.
El esquema del resto del art铆culo es el siguiente: en la secci贸n 2 se revisan las distintas tecnolog铆as implicadas, a continuaci贸n se explican las decisiones de dise帽o (secci贸n 3) que hemos tomado en la realizaci贸n del peri贸dico electr贸nico; la secci贸n 4 explica la arquitectura de la herramienta: el cliente del periodista, la base de datos de noticias, el servidor de noticias y el visor del cliente. La secci贸n 5 presenta las conclusiones del trabajo.
Estado del arte
Una de las razones del 茅xito de la tecnolog铆a Web es su simplicidad. Los usuarios no necesitan apenas formaci贸n para navegar por una p谩gina Web y gracias a la enorme cantidad de herramientas existentes la creaci贸n de p谩ginas HTML es un proceso sencillo. Por otra parte tambi茅n se ha observado en estos 煤ltimos a帽os la evoluci贸n en la concepci贸n de los documentos. As铆 hemos pasado de los documentos de texto unidimensionales que no contienen informaci贸n sobre s铆 mismos a documentos HTML bidimensionales(contienen etiquetas que describen sus elementos) y permiten la navegaci贸n.
Pero la funcionalidad de los documentos HTML es bastante limitada ya que por una parte el estilo y la l贸gica del documento est谩n predefinidos y por otra parte la misma simplicidad de la tecnolog铆a Web hace que no se aproveche la capacidad de procesamiento de la m谩quina cliente, que ha quedado convertida en un simple visualizador, obligando as铆 a conectarse al servidor para cualquier interacci贸n (como filtrar los resultados de una consulta en una base de datos, etc) Surge por tanto la necesidad de emplear documentos m谩s complejos que puedan interaccionar con el usuario de forma independiente del servidor y que puedan ser presentados, almacenados, catalogados, consultados e incluso enviados de forma m谩s eficiente.
Tanto los plug-ins como Java permiten a帽adir funcionalidad al Web, pero ambos obligan al navegador a interpretar programas independientes del propio documento. Las grandes compa帽铆as est谩n dirigiendo sus esfuerzos hacia una concepci贸n orientada a objetos del documento, tanto Microsoft como Netscape han propuesto un modelo de objetos [5] para su estandarizaci贸n por el World Wide Web Consortium. La idea com煤n es considerar tanto el documento en s铆 mismo como los elementos predefinidos por HTML que contiene (cabeceras, listas, tablas, etc ) como objetos programables y definir su presentaci贸n mediante hojas de estilo [3] y su l贸gica, as铆 como la forma de responder frente a eventos de usuario mediante JavaScript.
Este nuevo paso permite interaccionar parcialmente al usuario con el documento sin necesidad de conectarse con el servidor (ej: formularios que validan si todos sus campos est谩n correctamente rellenos antes de ser enviados al servidor). El problema actual radica en que las etiquetas HTML son demasiado limitadas y cambiantes ([4]), por eso surge la necesidad de un lenguaje m谩s potente como XML [1] que permita catalogar, almacenar y buscar informaci贸n de los documentos de forma estructurada, y que proporcione mecanismos de hipertexto m谩s ricos y flexibles.
XML es el nuevo lenguaje de marcado ``extensible'' dise帽ado por el organismo regulador de tecnolog铆a del Web (W3 Consortium) que permite el uso en Internet de SGML (un est谩ndar de marcado que lleva funcionando desde hace a帽os en muchos dominios dedicados a la publicaci贸n de informaci贸n escrita). XML permite ``inventar'' conjuntos de etiquetas de marcado de textos para dominios particulares de usuarios, facilitando as铆 la creaci贸n de lenguajes personalizados. De este modo los documentos se convierten en contenedores de objetos definidos por nosotros mismos (mediante etiquetas personalizadas) que incluyan instrucciones sobre como deben ser procesados (JavaScript), presentados (CSS) y que puedan interaccionar con otros programas (Java, plug-ins, etc). La estructura l贸gica del documento (informaci贸n relativa a las etiquetas que contiene) puede definirse en un fichero aparte llamado DTD (Document Type Definition) y pueden crearse programas que validen esta estructura.
Las 煤ltimas tendencias en periodismo electr贸nico se est谩n enfocando en el uso de la tecnolog铆a PUSH, que permite que se puedan recibir las noticias del servidor del peri贸dico sin que sea necesaria la intervenci贸n del usuario lector. De esta forma, el lector del peri贸dico ya no tiene necesariamente que solicitar una recarga de su p谩gina de titulares de noticias cada vez que quiera ver qu茅 novedades han acontecido, sino que esa actualizaci贸n se realiza autom谩ticamente. Es el propio servidor de noticias el que se encarga de mantener actualizadas las p谩ginas que est谩n visualizando sus clientes. En este sentido, se ha empezado a hablar ya de canales o conexiones entre clientes y servidores de Web en los que la informaci贸n es actualizada de forma continua. En la actualidad existen algunos tipos de canales funcionando en Internet (como los canales CDF de Microsoft).
La aproximaci贸n del ``PULL inteligente'' consiste en que el propio cliente el encargado de conectarse autom谩ticamente con el servidor para actualizar su informaci贸n. Esto lleva a una descentralizaci贸n del control, el servidor se ve liberado de una buena parte de la carga, posibilitando el acceso a un mayor n煤mero de usuarios simult谩neamente.
Decisiones de dise帽o
En el dise帽o de un peri贸dico electr贸nico, la tecnolog铆a empleada debe ser escogida con cuidado: lo que es usado hoy se volver谩 obsoleto antes de lo que uno se imagina. Las tecnolog铆as que hemos considerado en este trabajo son: XML, PUSH/PULL inteligente, CSS, Java y JavaScript.
En la actualidad, el contenido de informaci贸n ``pura'' en los documentos de HTML de un peri贸dico electr贸nico de primera generaci贸n (como puede ser EL PAIS DIGITAL o EL MUNDO) ocupa (en media) entre el 50% y el 70% de su tama帽o f铆sico en bytes. El resto de la p谩gina contiene etiquetas HTML que sirven para dar formato al documento dentro de la pantalla (tablas con bordes invisibles para lograr el efecto de columnas, espaciadores, colores, fuentes y tama帽os de letra, botones de navegaci贸n, ...) y que, adem谩s de ser fijos y establecidos de una forma no configurable por el lector (pues est谩n embebidos en los documentos HTML), apenas var铆an entre las distintas p谩ginas de un mismo peri贸dico.
En este sentido resulta 煤til poder separar el contenido de un documento de los aspectos de presentaci贸n. Una de las decisiones b谩sicas de nuestro proyecto es la selecci贸n de XML como lenguaje de etiquetado para la descripci贸n de contenidos, en lugar de basarnos en la tecnolog铆a actual de HTML. Bas谩ndonos en la definici贸n de etiquetas de HTML estos principios, hemos definido sobre XML nuestro propio lenguaje JML (Journalism Mark-up Language) y hemos formalizado su gram谩tica de acuerdo con las normas de XML mediante la expresi贸n de su DTD (document type definition).
Dentro de la tecnolog铆a PUSH, hemos considerado la utilizaci贸n de canales CDF, pero son espec铆ficos de algunos fabricantes, y no funcionan en otros navegadores. Adem谩s la tecnolog铆a PUSH requiere mantener recursos en el servidor en funci贸n del n煤mero de usuarios y del servicio que se le quiera dar. Este hecho unido a la personalizaci贸n del peri贸dico, nos hizo decidirnos por una combinaci贸n de la tecnolog铆a PUSH con el PULL inteligente. La principal desventaja del ``PULL inteligente'' radica en que el peri贸dico no tiene un mecanismo directo para evaluar las preferencias de sus lectores.
Todas estas decisiones en cuanto a la selecci贸n de las distintas tecnolog铆as van orientadas a conseguir uno de los principales objetivos de dise帽o fijados: la personalizaci贸n. La elaboraci贸n de un peri贸dico personalizado permite atender a las necesidades espec铆ficas de los distintos lectores.
El proceso de personalizaci贸n tiene lugar en dos fases. La primera consiste en la personalizaci贸n de los contenidos por parte del servidor antes de enviar la noticia al lector. En una segunda fase se describen los distintos aspectos de la personalizaci贸n en la presentaci贸n (que abarca tanto la estructura y formato con que se muestra la informaci贸n en la pantalla como la estrategia de navegaci贸n escogida) La figura 1 ilustra las distintas fases en el proceso de personalizaci贸n.
Figure 1: Personalizaci贸n del peri贸dico electr贸nico
Arquitectura
Nuestro sistema est谩 compuesto por varios elementos, como puede verse en la figura 2. Por una parte, los periodistas hacen uso del cliente para periodistas mediante el cual pueden etiquetar la noticia e insertarla en un repositorio. De este repositorio o base de datos, se extraen los distintos elementos que componen las noticias (texto, v铆deo, imagen, etc) y el servidor se encarga de su composici贸n en formato JML atendiendo a aspectos adicionales como el perfil del usuario, la inserci贸n de publicidad, etc, para su env铆o.
El cliente, recibe as铆 una edici贸n personalizada del peri贸dico en formato JML y la preprocesa en su visor mediante un plug-in que la transforma en formato HTML. Este plug-in ser谩 prescindible cuando los navegadores sean capaces de presentar documentos XML de de forma nativa, igual que ahora ocurre con HTML.
El perfil de usuario puede hacer referencia a un usuario concreto o a una comunidad virtual de distintos lectores que dispongan del mismo perfil. De cara a estas comunidades virtuales se podr铆a optimizar el proceso de generaci贸n del peri贸dico mediante el uso de tablas de hash y caches en el servidor.
Figure 2: Arquitectura del servidor de noticias
Cliente para periodistas
Esta nueva concepci贸n del periodismo afecta tambi茅n al proceso de creaci贸n y edici贸n de las noticias. Por una parte, el periodista no se ve limitado por el espacio f铆sico de una columna de papel, tiene a su disposici贸n nuevas formas de comunicaci贸n para presentar la informaci贸n a sus lectores (im谩genes de alta calidad, animaciones, sonido, v铆deos, etc), adem谩s ya no tiene porqu茅 dirigirse a un p煤blico concreto, puede escribir noticias ``multidimensionales'' permitiendo presentar distintas l铆neas de informaci贸n con distintos niveles de profundidad que permitan una posterior personalizaci贸n por parte del usuario, es decir una noticia que pueda leerse de varias formas. Todas estas nuevas posibilidades enriquecen y a la vez complican el proceso de creaci贸n de una noticia. Por una parte el periodista debe elegir los elementos multimedia m谩s adecuados para presentar una noticia, y por otra debe considerar cu谩ntos niveles de profundidad o desde cu谩ntos enfoques quiere hacerla accesible.
El editor debe considerar adem谩s que las noticias ``envejecen'' con el paso del tiempo, y requieren por tanto un mantenimiento constante, o un par谩metro que mida su obsolescencia (ej.: una etiqueta que haga referencia a la ``importancia'' de la noticia).
Desde el punto de vista tecnol贸gico todo esto se reduce a una sola cosa: Necesitamos tener en el documento informaci贸n relativa a su estructura (metadatos).
El lenguaje de etiquetado debe ser ``transparente'' para el periodista, por tanto la herramienta de generaci贸n de noticias consiste b谩sicamente en una aplicaci贸n multiplataforma con un interfaz gr谩fico amigable que le permita insertar f谩cilmente informaci贸n estructurada (inserci贸n autom谩tica de etiquetas) y mantener actualizado el peri贸dico de una forma f谩cil y c贸moda sin necesidad de disponer de conocimientos t茅cnicos especiales.
Esta aplicaci贸n escrita en Java presenta al periodista una ventana formulario con campos f谩cilmente rellenables en los que se insertan los metadatos de la noticia que est谩 publicando (autor, t铆tulo, secci贸n a la que pertenece, importancia, ...). De esta forma, el periodista se preocupa s贸lo por el contenido de la noticia y su estructura interna, no por la apariencia f铆sica que va a tener 茅sta ante el lector (la cual depende de sus preferencias).
El cuerpo de la noticia puede ser editado con cualquier herramienta externa, que bien puede ser un simple editor de textos, o un editor gen茅rico de (XML/JML). Las versiones m谩s recientes de Emacs tienen extensiones para SGML, y otras herramientas como ADEPT-Editor permiten adem谩s de la inserci贸n autom谩tica de etiquetas, la validaci贸n de la gram谩tica descrita en el DTD. Una vez confeccionada la noticia y si todos los campos del formulario se han rellenado correctamente se procede a su inserci贸n en la base de datos que se describe en el punto siguiente.
Base de datos de noticias
La base de datos almacena todos los elementos de informaci贸n (noticias, reportajes, fotograf铆as, ...) publicados por el peri贸dico hasta la fecha actual. La principal novedad es la importancia que se atribuye a los metadatos introducidos por el periodista y la estrecha relaci贸n que guardan con las etiquetas JML definidas en la gram谩tica (DTD).
Estas etiquetas corresponden a campos de la base de datos que podr铆amos clasificar en tres grandes grupos: los campos b谩sicos del documento (identificador de la noticia, t铆tulo, autor, etc), la informaci贸n sobre su contenido (secci贸n, g茅nero, etc) y la informaci贸n para la gesti贸n (nivel de importancia de cada noticia, enlaces, etc). En el siguiente apartado se describen estos campos con mayor detalle.
Los metadatos particularizados para dominios concretos (en nuestro caso documentos period铆sticos) proporcionan una gran potencia y flexibilidad tanto para la creaci贸n y almacenaje de los documentos como para su posterior recuperaci贸n mediante b煤squedas, etc.
Este repositorio de noticias puede estar mantenido por cualquier servidor de base de datos relacional que tenga interfaz SQL y que permita accesos por red. Para nuestras pruebas, hemos seleccionado el servidor de base de datos de libre distribuci贸n MySQL, que funciona de forma fiable en muy variadas plataformas y sistemas operativos, y m谩s concretamente, en una red de m谩quinas Linux. Esta base de datos se puede sustituir por otras que tambi茅n dispongan de interfaz SQL comoMS SQL Server de Microsoft, Oracle, Informix, etc. El acceso a la base de datos queda restringido al cliente para periodistas y al servidor de noticias, que es el encargado de hacer llegar la informaci贸n a los lectores del peri贸dico.
El cliente de periodistas puede acceder a la base de datos tanto para crear contenido, como para modificarlo, usando para ello un formulario que permita insertar correctamente las modificaciones en el elemento adecuado del documento.
Por otra parte el servidor de noticias accede a la base de datos mediante consultas SQL. Estas consultas se basan en el perfil del usuario cuando el servidor funciona en modo publicaci贸n o en los distintos campos de b煤squeda introducidos en un formulario por el lector cuando el servidor funciona en modo hemeroteca.
Cada uno de los elementos almacenados en la base de datos contiene informaci贸n sobre s铆 mismo (metadatos) que sirven para confeccionar los documentos en JML que se le presentan al lector. Ejemplos de estos metadatos son:
- Una etiqueta que indique el tipo de elemento (reportaje, entrevista, opini贸n, ...).
- La secci贸n o secciones a la que pertenece (nacional, internacional, econom铆a, ...).
- Los distintos tipos de encabezamiento (t铆tulo, antet铆tulo, subt铆tulo, entradilla, ...).
- Datos sobre el autor, la fecha y el lugar del suceso.
- Enlaces a otras noticias con las que tenga relaci贸n.
- Indicaciones sobre la conveniencia de que ciertos anuncios (publicidad) aparezcan cerca de la noticia.
- Y por supuesto, el cuerpo de la misma, en formato JML, con indicaciones sobre el grado de importancia que el periodista haya querido atribuir a trozos de la noticia (los cuales servir谩n para decidir si se deben mostrar o no dependiendo del inter茅s que tenga el lector en conocer todos los detalles de la noticia).
<JML>
<JML_HEAD>
<JML_TITLE> Kosovo y nosotros </JML_TITLE>
<JML_DATE> 3 abril de 1998</JML_DATE>
<JML_PLACE> Kosovo, Yugoslavia </JML_PLACE>
<JML_SECTION> Opini贸n </JML_SECTION>
<JML_AUTHOR> Gurutz J谩uregui </JML_AUTHOR>
</JML_HEAD>
<JML_BODY>
<IMPORTANCE LEVEL=0>La nueva crisis en los Balcanes...</IMPORTANCE>
<IMPORTANCE LEVEL=1>En primer lugar, no conviene olvidar que...</IMPORTANCE>
<IMPORTANCE LEVEL=0>Por ello, Europa no puede ampararse...</IMPORTANCE>
<IMPORTANCE LEVEL=2>A ello hay que a帽adir que...</IMPORTANCE>
</JML_BODY>
</JML>
Servidor de noticias
Una de los principales novedades a la hora de ``servir'' las noticias a los lectores del peri贸dico es la personalizaci贸n. Mientras que antes el peri贸dico deb铆a llegar a un equilibrio entre el espacio disponible y los contenidos a tratar para llegar mediante una edici贸n 煤nica y homog茅nea a la mayor cantidad de p煤blico posible. Ahora las nuevas tecnolog铆as ofrecen la posibilidad de personalizar los contenidos y su nivel de profundidad de detalle para atender las necesidades de cada uno de sus lectores individualmente. Esta capacidad de personalizaci贸n es uno de los valores a帽adidos m谩s importantes de la prensa electr贸nica.
Esta nueva funcionalidad requiere llevar a cabo un proceso de selecci贸n de noticias en el servidor que se adecue a los intereses de cada lector. Mediante este proceso de selecci贸n de noticias se consigue no s贸lo un mejor acercamiento del lector a la informaci贸n que le interesa, sino adem谩s un aprovechamiento m谩s 煤til de la capacidad de transmisi贸n (ancho de banda) de la red.
Para llevar a cabo la selecci贸n de las noticias ser谩 necesario caracterizar a los distintos lectores. Esta caracterizaci贸n puede ser individual (si se tienen en cuenta las preferencias de cada lector de forma personal) o por grupos afines (se incluye al lector en el grupo de lectores interesados por unos mismos contenidos) y se llevar谩 a cabo mediante la elaboraci贸n de perfiles de usuario a partir de formularios que rellene el propio lector la primera vez que se conecte.
El env铆o de los documentos JML a los usuarios se realiza mediante tecnolog铆a PUSH combinada con pull-inteligente.
El servidor es una capa intermedia entre la base de datos y el lector y proporciona los servicios de publicaci贸n y hemeroteca digital. Consta de un servidor Web y uno o varios programas CGI que atienden las peticiones de los lectores.
- Servicio de publicaci贸n: La publicaci贸n del peri贸dico consiste en el env铆o al lector de un peri贸dico individualizado en formato JML atendiendo a sus preferencias. En la mayor铆a de los accesos (estimamos que en m谩s de un 98% de los mismos) el servidor act煤a de este modo.
El servidor es capaz de construir el peri贸dico mediante consultas SQL basadas en el perfil del lector. Este fichero contiene informaci贸n sobre sus preferencias (parte de ellas declaradas por el mismo lector en el proceso de suscripci贸n al peri贸dico, parte de ellas aprendidas por el sistema a partir de las peticiones pasadas).
La personalizaci贸n de contenidos afecta a la cantidad y al tipo de informaci贸n que recibe el lector del peri贸dico, y es considerada antes de que esa informaci贸n sea enviada . En nuestra primera versi贸n del proyecto, esta caracterizaci贸n se captura en un formulario HTML que se almacena en el ordenador del cliente y del cual el servidor tiene copia. Entre la informaci贸n referente a las preferencias de contenidos del lector figurar谩n:
- Secciones del peri贸dico: (internacional, nacional, econom铆a, sociedad, deportes, ...)
- G茅neros de la informaci贸n: (sucesos, opiniones, entrevistas, ...)
- Temas de actualidad: (como por ejemplo: Internet, ciencia y tecnolog铆a, el aborto, etc.).
- Fuentes de informaci贸n: Nombres de periodistas o de agencias de noticias en los que el lector est茅 interesado.
Para cada una de las dimensiones anteriormente mencionadas, el lector del peri贸dico puede indicar su grado de inter茅s, que sumado al grado de importancia asignado por el peri贸dico a la noticia en s铆 misma y teniendo en cuenta su antig"uedad permite decidir su nivel de resalte en pantalla.
Adem谩s, el servidor de noticias considera la existencia de un inter茅s editorial o informaci贸n adicional que el peri贸dico desee introducir en todas las ediciones individualizadas (publicidad, editorial, opini贸n del peri贸dico, etc.), y se a帽ade al documento antes de su env铆o.
- Servicio de hemeroteca: Este servicio permite al lector acceder a noticias de mayor antig"uedad o realizar b煤squedas en la base de datos atendiendo a distintos par谩metros (fecha de publicaci贸n, autor, temas mencionados, secciones ...). Para ello se ejecuta una aplicaci贸n escrita en Java que se encarga de extraer las noticias pertinentes de la base de datos haciendo uso del interfaz SQL de la biblioteca JDBC de Java y generando JML din谩micamente.
Este tipo de acceso es m谩s costoso para el peri贸dico, pues supone una mayor carga de trabajo para su servidor, adem谩s, requiere que el n煤mero de clientes simult谩neos que hacen uso de la hemeroteca digital no sobrepase cierto l铆mite con el fin de no ralentizar el funcionamiento del sistema.
Sin embargo, la posibilidad de abrir a los clientes la posibilidad de acceder a noticias con cierta antig"uedad, de realizar investigaciones en el peri贸dico mediante b煤squedas dirigidas por temas, hace pensar que muy probablemente, en la medida en la que esa hemeroteca tenga m谩s contenidos y abarque mayores periodos de tiempo, se pueda ofrecer como un servicio de valor a帽adido muy importante para el peri贸dico.
El visor del cliente
Tras la primera fase de personalizaci贸n de contenidos en el servidor, al cliente le llega una versi贸n del peri贸dico con una informaci贸n precisa, actualizada e individualizada donde encuentra las noticias presentadas no s贸lo seg煤n su nivel de importancia objetivo (en el panorama de la actualidad) sino tambi茅n introduciendo un grado de subjetividad (seg煤n sus intereses particulares).
Una vez que el lector ha recibido el peri贸dico puede especificar a煤n m谩s el nivel de personalizaci贸n seleccionando la forma de presentar los contenidos en pantalla y la estrategia de navegaci贸n.
Arquitectura
La herramienta del cliente consiste simplemente en un navegador Web con soporte XML (como se espera que sean los futuros Netscape Navigator 5.0 o Microsoft Internet Explorer 5.0). Mientras dichos navegadores no est茅n disponibles, se podr谩n utilizar visores de HTML tradicionales con un plug-in que incorpore un filtro que transforme JML en HTML.
Personalizaci贸n en la presentaci贸n
Dentro de los aspectos de presentaci贸n hacemos referencia no s贸lo a la forma de estructurar la informaci贸n presentada (posici贸n de las distintas ``cajas'', colores, tama帽o de fuente, etc) sino tambi茅n a la estrategia de navegaci贸n escogida. A diferencia del caso anterior esta personalizaci贸n tiene lugar en la m谩quina cliente, despu茅s de que le ha llegado la informaci贸n.
La estructuraci贸n de las distintas cajas en la pantalla as铆 como el formato de la misma podr铆a hacerse mediante hojas de estilo en cascada (CSS) que permiten asociar un formato predeterminado (posici贸n, color, tama帽o de fuente, etc) a los distintos elementos estructurales de JML.
En principio, aunque el peri贸dico proporcione algunas CSS por defecto que definan su estilo, podr铆a ofrecerse al cliente la posibilidad de crear sus propias hojas de estilo.
Por otra parte la navegaci贸n puede hacerse atendiendo a diversos criterios.
- Navegaci贸n lineal: La informaci贸n se va presentando al usuario de forma secuencial, atendiendo a su perfil.
- Navegaci贸n tem谩ticamente relacional: La informaci贸n se presenta atendiendo a los temas de inter茅s para el lector. Las preferencias del lector frente a los distintos temas pueden obtenerse de varias formas: Directamente del formulario de personalizaci贸n, mediante un agente que detecte las preferencias del usuario de sus acciones anteriores o mediante la pertenencia de un lector a una comunidad virtual, sugiri茅ndole los temas que han resultado de inter茅s para la mayor铆a de sus miembros.
- 脥ndice /sub铆ndice: Siguiendo la met谩fora de un libro se presenta al lector una informaci贸n global del contenido del peri贸dico estructurada por temas, secciones, etc.
- B煤squeda: Se ofrece la posibilidad de navegar por el peri贸dico buscando, mediante el uso de palabras clave, los art铆culos sobre un tema concreto, un columnista en particular, etc. Este tipo de navegaci贸n puede realizarse sobre el peri贸dico recibido o sobre la hemeroteca digital.
- Profundizaci贸n: Seg煤n su grado de inter茅s o conocimiento de un tema en concreto el lector puede navegar por el peri贸dico viendo s贸lo los titulares, incluyendo un resumen de la noticia, o profundizando en su contenido hasta distintos niveles.
- Estructurada: la informaci贸n se presenta con una estructura interna que se cierra sobre s铆 misma, evitando la ``estructura en 谩rbol'' que hace que los documentos al final de una ``rama'' queden aislados o haya que volver por todos los documentos anteriores para llegar al cuerpo central de la noticia. Frente a esto se propone una estructura en bucles abiertos, donde el bucle es la unidad estructural del tejido hipertextual. El sistema estar铆a formado por n-2 pantallas, cada una de las cuales contendr铆a una informaci贸n inteligible por si misma pero no suficiente. La primera pantalla y la n-茅sima coincidir铆an (para formar el bucle). La conexi贸n entre los distintos bucles se har铆a mediante palabras activas (hipertexto). El n煤mero de bucles involucrados en un determinado art铆culo depende de la cantidad de informaci贸n tratada. Esta forma de presentar la informaci贸n permite fundir las ventajas del hipertexto con una navegaci贸n c贸moda para el lector que ya no necesita memorizar el camino recorrido hasta llegar a un punto dado para volver al tema central, es el propio sistema el que autom谩ticamente le de vuelve al bucle anterior. Por otra parte, de cara al editor, esta estructura permite una forma sencilla de actualizaci贸n de los contenidos, ya que la introducci贸n o la eliminaci贸n de parte del texto se traduce en desprender o encajar nuevos bucles.
Los criterios de navegaci贸n arriba descritos pueden combinarse o cambiar de uno a otro seg煤n los intereses del lector.
Conclusiones
La tradicional concepci贸n del periodismo se ha visto alterada por el espectacular crecimiento de Internet. Como consecuencia ha aparecido una nueva forma de periodismo: el periodismo electr贸nico. Nuestro enfoque va m谩s all谩 de la simple publicaci贸n electr贸nica del material tradicional y de nuevos elementos multimedia.
Hemos presentado JML, un lenguaje de marcado que hemos desarrollado bas谩ndonos en XML. JML incluye aspectos sem谩nticos de las noticias, haciendo posible la personalizaci贸n del peri贸dico y facilitando su almacenamiento y consulta.
La personalizaci贸n hace posible la diferenciaci贸n de contenidos, presentaci贸n y navegaci贸n. Los aspectos que hemos tenido en cuenta en la personalizaci贸n son el perfil del lector, su historial y su pertenencia a una comunidad virtual.
Tambi茅n hemos descrito la implementaci贸n realizada de un servicio de hemeroteca digital. Con la posibilidad de consultas ``sem谩nticas'' (gracias a la utilizaci贸n de JML) sobre la base de datos de noticias del peri贸dico.
Agradecimientos
El trabajo en el que se basa este documento ha sido parcialmente financiado por el proyecto TEL97-0788 de la CICYT. Queremos agradecer las aportaciones de nuestros compa帽eros Peter T. Breuer, Pilar Diezhandino, Tony Hern谩ndez, Natividad Mart铆nez, Tom谩s Nogales, A. Rodr铆guez de las Heras y Luis S谩nchez de la Universidad Carlos III de Madrid. Agradecemos tambi茅n la ayuda prestada por El PAIS Digital y Fundesco.
Referencias
- 1
- Tim Bray, Jean Paoli, and C. M. Sperberg-McQueen (eds): XML: Extensible Markup Language (XML) 1.0 W3C Recommendation, 10 Febrero 1998.
http://www.w3.org/TR/REC-xml - 2
- ``Information Processing - Text and Office Systems - Standard Generalized Markup Language (SGML)'' ISO 8879:1986, First edition. Geneva, 15 Octubre 1986.
- 3
- Bert Bos, H氓kon Wium Lie, Chris Lilley, Ian Jacobs (eds): CSS: Cascading Style Sheets, level 2 W3C Proposed Recommendation, 24-Mar-1998.
http://www.w3.org/TR/1998/PR-CSS2-19980324 - 4
- Dave Raggett, Arnaud Le Hors, Ian Jacobs (eds): HTML 4.0 Specification W3C Recommendation, 18 Diciembre 1997.
http://www.w3.org/TR/REC-html40-971218 - 5
- Lauren Wood, Jared Sorensen (eds): DOM: Document Object Model Specification, W3C Working Draft, 18 Marzo 1998.
http://www.w3.org/TR/WD-DOM-19980318 - 6
- Richard Light. Presenting XML Sams Net, Indianapolis 1997. ISBN 1575213346
- 7
- ed. Dan Connolly. XML: Principles, Tools and Techniques Sebastopol, CA: O'Reilly, 1997 (World Wide Web journal; 2-4).
- 8
- LT XML Language Technology Group, Human Communication Research Centre, University of Edinburgh.
http://www.ltg.ed.ac.uk - 9
- ADEPT·Editor: Authoring Software for Knowledge Capture
http://www.arbortext.com/editor.html - 10
- MySQL T.c.X. DataKonsultAB
http://ftp.sunet.se/pub/unix/databases/relational/mysql/index.html http://www.it.uc3m.es/~per/doc/evi98/evi98.html
.jpg)


