Learn to code-Code to learn


Sustainability: ¿reflejo de la impa-ciencia?

Nota: El color de texto LigthBlue señala links

Sustainability es una de las principales revistas de la editorial de accesso abierto MDPI.

En 10 años pasó de ser una completa desconocida a ser hoy la cuarta revista por artículos publicados a nivel mundial: 50 mil artículos y más de 130 mil citas.

Introducción

¿Ha llegado la cultura de la impaciencia a la ciencia?

El rapid, fast manuscript handling ya es una política de marketing de algunas editoriales de revistas científicas. Otras van directamente al grano haciendo mención al número de semanas que se tarda en publicar y a que precio.

La ANECA, en su informe sobre editoriales de acceso abierto, tuvo la intención de analizar la impaciencia mirando el tiempo que tarda un artículo en ser aceptado en la editorial MDPI pero no pudo acceder a los datos. Según la ANECA los datos globales no están disponibles y los datos por artículo son de difícil acceso.

Está claro que el tiempo durante el cual un artículo está siendo evaluado -sea este mucho o poco- no garantiza la fiabilidad del resultado. Any scientific paper can be wrong. No matter where it is published….

Sin embargo, en un contexto de recursos escasos: ¿es una asignación eficiente de recursos públicos el que un investigador pague el equivalente a 4 salarios IPREM para que su resultado se publique en el menor tiempo posible?

En este post resolvemos el problema de acceso a datos que tuvo la ANECA -adjuntamos el código más abajo- y mostramos que en menos de 40 días se acepta como válido el resultado científico de una investigación en Sustainability.

España: el país que más invierte en Sustainability

España acumula cerca de 4.500 artículos publicados en Sustainability, siendo el país de europa occidental con más publicaciones en esta revista.

En el gráfico se presenta el número de publicaciones en Sustainability frente al número de investigadores en universidades por país (datos de Eurostat). El área del círculo está correlacionada con el ratio de publicaciones a investigadores.

En el gráfico se observa que:


En cuántos días se acepta un artículo en Sustainability

El informe de la ANECA sobre acceso abierto se propuso analizar los tiempos del proceso evaluación de una publicación.

El problema que se encontró la ANECA con la editorial MDPI es que la información sobre los tiempos de evaluación de una publicación era de díficil acceso por lo que no pudo disponer de datos para realizar el estudio. Citando al informe de la ANECA, “lamentablemente, no existen datos globales para MDPI, si bien esta información sí aparece individualmente en cada uno de los artículos que publica”.

En este post presentamos los resultados de extraer la información de la historia del proceso de evaluación de cada artículo utilizando un código de Python que se comparte más abajo. Aquí presentamos brevemente los resultados del tiempo de publicación en la revista Sustainability de casi 14 mil artículos publicados por investigadores de Alemania, España, Italia, Portugal y el Reino Unido.

La Tabla presenta la mediana, el primer y tercer cuartíl de los dias que tarda un artículo enviado a Sustainability en el proceso hasta su publicación.

Sustainability: número de días en el proceso de publicación de un artículo

Proceso Recibido-Revisado Recibido-Aceptado Revisado-Aceptado
Cuantiles 25% 50% 75% 25% 50% 75% 25% 50% 75%
2014 73.25 91.5 121.0 72.75 92.0 121.75 1.0 3.0 9.25
2016 44.00 64.0 86.0 52.00 72.0 91.00 2.0 6.0 11.00
2018 23.00 33.0 47.0 27.00 38.0 52.00 1.0 3.0 7.00
2020 21.00 29.0 41.0 24.00 33.0 46.00 1.0 3.0 6.00
2022 23.00 32.0 44.0 28.00 37.5 50.00 2.0 4.0 7.00


Si nos fijamos en la mediana, vemos que:

Notas:


¿Existen diferencias en el tiempo de evaluación según el tópico del artículo?

Dado que Sustainability publica una enorme variedad de temas podría resultar interesante analizar si el tiempo de evaluación está asociado a la “rareza” de un tópico.

Para intentar responder a esta pregunta hemos ordenado los tópicos de los más de 13.700 artículos publicados en Sustainability por investigadores de Alemania, España, Italia, Portugal y Reino Unido utilizando la información de abstracts y keywords.

A grandes rasgos, lo que hemos hecho es:

  • Hemos buscado similitudes en las más de las 70 mil keywords que definen los artículos con el objetivo de hacer una búsqueda guiada de temas, e.g., paraphrase mining.

  • Hemos analizado la clasificacion en tópicos utilizando diferentes metodologías, e.g. LDA, UMAP-HDBSCAN o directamente con BerTopic.

El gráfico presenta los tópicos utilizando Guided BerTopic donde las guías estaban basadas en las keywords más usuales, con un minimum cluster size de 15 y obteniendo un coherence level de 0.51.


Hasta aquí hemos llegado