Scroll Top

Merece la pena o no publicar en formato XML JATS

 

 

Pedro Lázaro Rodríguez, Profesor del Departamento de Biblioteconomía y Documentación, Universidad Complutense de Madrid

 

 

Revista de Investigación sobre Bibliotecas, Educación y Sociedad (RIBES).
https://revistas.ucm.es/index.php/RIBE/index
https://www.pedrolr.es

PREGUNTA

Quería compartir una inquietud/pregunta sobre el formato XML JATS y la publicación de trabajos en dicho formato en revistas. Se ha hablado de este formato antes, pero diría que no en el sentido en que lo hago aquí. La inquietud tiene un doble acercamiento;

En primer lugar, si merece la pena publicar en este formato; esto es: si las ventajas que aporta –o se supone aporta– justifican lo que hay que hacer para generar los trabajos en dicho formato.

En segundo lugar, si las revistas que no publican en este formato, presentan desventajas reales frente a las que sí lo hacen.

Comparto estas inquietudes porque cuanto más leo y más conozco sobre JATS, menos convencido estoy de su utilidad (valoración personal), especialmente teniendo en cuenta los recursos –bien propios o bien externos– que hay que dedicar para generarlos.

Añado que en la revista en que estoy al frente de la secretaría de redacción, publicamos los trabajos en PDF, HTML, EPUB y XML JATS. Hemos desarrollado un proceso sin depender de servicios externos y utilizando software libre que permite automatizar buena parte del proceso de conversión desde un DOC a todos los demás formatos: el DOCX lo convertimos a HTML y a EPUB con el software libre Pandoc, y desde el HTML hemos automatizado en un alto grado la conversión a JATS con scripts propios desarrollados en Python utilizando principalmente BeautifulSoup y el módulo re.

Pero aún sí, personalmente no termino de ver claro su utilidad teniendo en cuenta todo el proceso y tiempo que hay que echar, o los servicios que las revistas acaban externalizando. En nuestra revista lo relevante en cuanto a visitas y descargas de archivos viene por los formatos PDF y HTML (más del 75% de las descargas; y sin poder filtrar las que se hacen desde EPUB con respecto a JATS pues se engloban en la categoría “otros”).

Será genial conocer opiniones de por qué trabajar los XML JATS o no según sus ventajas, no ventajas e incluso desventajas.

RESPUESTAS

 

 

Dagoberto Salas, Universidad Autónoma de Nuevo León, San Nicolás de los Garza, México

 

 

 

Considero que existe una confusión generalizada sobre este tema. El XML es esencialmente un archivo de datos diseñado para ser interpretado y procesado por sistemas automatizados. Las plataformas que requieren estos archivos son principalmente agregadores científicos como SciELO, Redalyc, entre otros, cuyos sistemas procesan estos XML para extraer datos bibliométricos y generar formatos derivados como PDF, HTML o EPUB.

En mi opinión, publicar un XML-JATS directamente en OJS (por ejemplo) resulta innecesario, ya que ningún sistema consultará este archivo desde su ubicación original. El XML-JATS es un archivo que se entrega específicamente a los sistemas de indexación mencionados.

No tengo la certeza de que gestores de referencias bibliográficas como Zotero o Mendeley  lo consideran para sus procesos. Para indexación en plataformas como DIALNET, se utiliza el XML con formato Dublin Core, que se obtiene mediante la interfaz OAI.

Recomendaría generar XML en los siguientes casos:

– Cuando un sistema de indexación lo solicite específicamente.
– Cuando su sistema de gestión editorial utilice este XML para generar dinámicamente diferentes formatos de salida (PDF, EPUB, TXT, DOCX, etcétera).
– Para implementar estrategias de preservación digital en formato XML.

Es importante aclarar que no considero inútil la creación de XML-JATS. Existen diversos sistemas gestores de revistas que utilizan el XML-JATS como insumo principal para procesar las galeradas de salida, aunque nunca debería presentarse el XML como una galerada en sí misma.