Upload
others
View
10
Download
0
Embed Size (px)
Citation preview
Universidad de La Salle Universidad de La Salle
Ciencia Unisalle Ciencia Unisalle
Recursos bibliográficos Dirección de Bibliotecas
2020
Guía para la visualización de datos: Bibliometrix Guía para la visualización de datos: Bibliometrix
Follow this and additional works at: https://ciencia.lasalle.edu.co/recursos_bibliograficos
Recommended Citation Recommended Citation "Guía para la visualización de datos: Bibliometrix" (2020). Recursos bibliográficos. 30. https://ciencia.lasalle.edu.co/recursos_bibliograficos/30
This Recurso interactivo is brought to you for free and open access by the Dirección de Bibliotecas at Ciencia Unisalle. It has been accepted for inclusion in Recursos bibliográficos by an authorized administrator of Ciencia Unisalle. For more information, please contact [email protected].
GUÍA PARA LA VISUALIZACIÓN DE DATOS: Bibliometrix
Dirección de BibliotecasVig
ila
da
Min
ed
uca
ció
n
BienvenidosBibliometrix
aplicación para estudios bibliométricos basada en RNota aclaratoria: Esta guía es una introducción a la aplicación Bibliometrix.
2
3
Tabla de contenido
1. Introducción 4
2. Instalación de Rstudio 6
3. Ejecución de Bibliometrix desde Rstudio 10
4. Trabajando datos con Bibliomtetrix 16
INTRODUCCIÓN
4
1
¿QUÉ ES BIBLIOMETRIX?
5
En el año 2016 dos italianos Massimo Aria y CorradoCuccurullo crearon una interfaz en ambiente Web con base en R llamado Bibliometrix con el propósito de brindar un conjunto de herramientas para la investigación cuantitativa en estudios cienciométricos y bibliométricos. Para poder ejecutar la aplicación es necesario tener instalado R y RStudio, en nuestro caso ya hemos instalado R entonces ahora veremos cómo instalar RStudio.
INSTALACIÓN DE RSTUDIO
6
2
INSTALANDO RSTUDIO
7
Ingrese a la página de RStudio digitando en su navegador: rstudio.com. Una vez estando en la página busque el vínculo de descarga con la palabra DOWNLOAD e ingrese en esa opción.
INSTALANDO RSTUDIO
8
En la siguiente ventana seleccione la opción de descarga gratuita.
En el caso de tener Windows haga clic en el icono DOWNLOAD RSTUDIO FOR WINDOWS
Esta selección lo lleva al vínculo directo para empezar la descarga. Si su sistema operativo es distinto a Windows seleccione en la lista el SO de su pc.
INSTALANDO RSTUDIO
9
Después de unos minutos se termina la descarga del archivo para ejecutar la instalación. Vaya a la carpeta de descargas de su sistema y ejecute el programa de instalación.
Siga todos los pasos de la instalación y permita que se genere un acceso directo en el escritorio.
EJECUCIÓN DE BIBLIOMETRIX DESDE RSTUDIO
10
3
EJECUTANDO BIBLIOMTERIX
11
Una vez terminada la instalación ejecute la aplicación de RStudio.
EJECUTANDO BIBLIOMETRIX
12
Como se ha dicho Bibliometrix es una aplicación que funcionan con base en R, es necesario instalar el paquete en nuestra interfaz de RStudio. En el tablero de la parte superior izquierda digite el siguiente comando: install.packages("bibliometrix"), luego accione el icono con la palabra Run:
De forma inmediata el tablero de la parte inferior izquierda del programa comienza a trabajar en la instalación de Bibliometrix.
EJECUTANDO BIBLIOMETRIX
13
Cuando termine la instalación verifique que esté instalado el paquete yendo al tablero de la parte inferior derecha, seleccione la opción “Packages” y en el cajón de búsqueda digite bibliometrix y este debe aparecer en la lista de nombres.
EJECUTANDO BIBLIOMETRIX
14
Ahora es necesario llamar el paquete Bibliometrix y el comando que ejecuta la interfaz en el ambiente Web que se denomina “biblioshiny”. Copie las siguientes líneas en el tablero de la parte superior izquierda de RStudio:
library(bibliometrix)
biblioshiny()
Con el cursor del mouse selecciones las dos líneas copiadas y haga clic en Run nuevamente, verifique que antes de ejecutar Bibliometrix tenga un navegador abierto, preferiblemente Google Chrome.
EJECUTANDO BIBLIOMTERIX
15
En su navegador se abre la ventana de la interfaz de Bibliometrix
TRABAJANDO DATOS CON BIBLIOMETRIX
16
4
RECUPERACIÓN DE LOS DATOS
17
Ahora se puede comenzar con el análisis de los datos de una búsqueda específica sobre un tema, para esto ingres en la base de datos Scopus y realice la búsqueda de los documentos publicados en su tema de interés, para nuestro caso vamos a buscar los documentos publicados con Afiliación de la Universidad de la Salle.
RECUPERACIÓN DE LOS DATOS
18
Selecciono los documentos publicados por la universidad.
RECUPERACIÓN DE LOS DATOS
19
En el dataset de todos los documentos selecciono la opción “ALL” e ingreso a la opción “Export” .
RECUPERACIÓN DE LOS DATOS
20
En esta opción selecciono todas las opciones de información de los registros y marque la opción de formato de “Bibtex” para la descarga, luego de esto haga clic en el ícono “export” de la parte inferior derecha.
Ya con el archivo descargado se verifica en dónde quedo guardado, que por lo general está en la carpeta de descargas del computador
CARGAR LOS DATOS EN BIBLIOMETRIX
21
Ahora vuelva a la interfaz de Bibliometrixque se abrió en su navegador, vaya a la opción Data y en ésta seleccione “ImportLoad files”.
Aparece una ventana con las opciones del archivo que voy a importar, para
esto seleccione las opciones como están en la imagen, busque el archivo con la opción “Browse”, cárguelo y luego haga clic en el ícono “Start”
CARGAR LOS DATOS EN BIBLIOMETRIX
22
En ese momento Bibliometrix comienza la ejecución de todas sus herramientas y se puede empezar a hacer el análisis de acuerdo con sus necesidades o expectativas.
En primera instancia la interfaz muestra un dataset con toda la información en texto sobre cada una de las publicaciones recuperadas en la búsqueda. Si se observa en la parte izquierda inferior en el título “Conversion results” debe coincidir el número de documentos con los que se descargaron de Scopus
CARGAR LOS DATOS EN BIBLIOMETRIX
23
LA OPCIÓN DE FILTROS
24
La primera opción que presenta Bibliometrix para analizar los datos son los Filtros que puedo aplicar si deseo minimizar las variables de análisis. En la Opción “Filter” se pueden limitar los datos por tipo de documento, año de publicación, citas recibidas y en caso de más experticia por las zonas de la Ley de Bradford.
LA VARIABLE DATASET
25
La segunda alternativa que nos presenta la aplicación es datos sobre el total del “Dataset”, en esta podemos obtener la información principal del total de los documentos, producción científica anual, citación promedio por año y una gráfica que puede combinar tres variables.
Seleccione la primera Opción de la variable “Dataset”: Main Information. Ahí se visualiza la información total de los datos recuperados en la búsqueda de Scopus. La información se puede descargar en formatos CSV, Excel, PDF o se puede imprimir de una vez tal como aparece.
LA VARIABLE DATASET
26
LA VARIABLE DATASET
27
En la segunda opción de la misma variable “Dataset” se puede observar la Producción Científica Anual.
La información se puede ver en forma de gráfico o en una tabla las cuales se pueden descargar ya sea en formato png la gráfica o la tabla en CSV, Excel o PDF como se puede observar en las gráficas siguientes:
LA VARIABLE DATASET
28
LA VARIABLE DATASET
29
En la tercera opción de la misma variable “Dataset” aparece el Promedio de Citas por Año con las mismas características de la opción anterior en cuanto a la visualización y opciones de descargas.
LA VARIABLE DATASET
30
En primera instancia se visualiza el gráfico del promedio de citaciones por año. Este promedio se obtiene de dividir el promedio de artículos por año sobre las citas por año, datos que se puede ver en la tabla.
LA VARIABLE DATASET
31
La última opción de la variable “Dataset” es una de las operaciones más interesantes de esta aplicación, pues permite hacer un gráfico que relaciona tres campos que el usuario puede elegir según su análisis.
LA VARIABLE DATASET
32
En la parte izquierda de la página están los filtros que se pueden aplicar para generar el gráfico. La primera variable que se puede aplicar corresponde a la columna del medio de la gráfica, la segunda a la columna de la izquierda y la tercera a la columna de la derecha. Es de aclarar que las variables que allí aparecen son las que se pueden relacionar entre sí para generar este gráfico. También en cada campo se puede elegir el número de ítems para cada uno, en el caso de este ejemplo se trabaja con 20 ítems.
Para este caso se relacionan los campos de Autor, Afiliación y País.
LA VARIABLE DATASET
33
Si se desea distinguir el nombre de una institución, autor o país paso el cursor sobre el nombre seleccionado y las líneas de la relación se tornan en un tono más oscuro que los demás.
LA VARIABLE SOURCES
34
La siguiente variable corresponde a “Sources” que traduce Fuentes, para este caso el título de las revistas en las cuales se publican los artículos.
En la primera opción de dicha variable se observa las revistas más relevantes en cuanto al número de artículos publicados en cada fuente.
LA VARIABLE SOURCES
35
Como en las anteriores visualizaciones de este tipo se tiene un gráfico y la tabla correspondiente que se pueden descargar si así se desea.
LA VARIABLE SOURCES
36
La segunda opción de la variable “Sources” muestra las fuentes más citadas de la información que se ha descargado en el dataset de Scopus.
LA VARIABLE SOURCES
37
En la opción siguiente de la misma variable se puede observar la gráfica con su respectiva tabla sobre la Ley de Bradford.
Conocida también como Ley de dispersión de la literatura científica. Se trata de una relación entre el número de revistas y el número de artículos científicos publicados en esas revistas acerca de un tema de investigación específico.
Esta ley trata de demostrar que en la producción de artículos en las revistas existe una distribución altamente desigual donde la mayoría de los artículos están concentrados en una pequeña población de revistas, mientras que una pequeña proporción de artículos se dispersa sobre una alta cantidad de artículos. (EcuRed, 2020)
LA VARIABLE SOURCES
38
LA VARIABLE SOURCES
39
Siguiendo con la variable “Sources” se observa la opción Impacto de la Fuente y hace referencia de cómo están las revistas en cuanto al impacto en los Índices H, G y M; así como también el total de citas.
Recordando, el Índice H es el resultado aplicado a un investigador o en este caso a una revista sobre el número de H artículos que han sido citado H veces, es decir, si el Índice H es igual a 5 quiere decir que se tienen 5 publicaciones que han sido citada por lo menos 5 veces.
LA VARIABLE SOURCES
40
Para el cálculo del Índice G, se listan los artículos de un autor en orden descendente de acuerdo con el número de citas recibidas por cada uno de ellos, como plantea la metodología de Hirsch. El mayor número de orden en el ranking donde la sumatoria de citas recibidas por el autor sea mayor o igual al cuadrado del número de orden, será considerado el Índice G de ese autor. De esta forma, se obtiene un indicador que considera la cantidad de citas recibidas por los artículos más citados de un autor, aspecto que no es tan significativo para el Índice H. (Arenbivia, R. & Carvajal, E., 2008. p. 3)
LA VARIABLE SOURCES
41
Para el cálculo del Índice R o M, la metodología es mucho más sencilla, por cuanto sólo se consideran los artículos comprendidos en el núcleo H, y no es más que la raíz cuadrada del total de citas recibidas por estos artículos. (Arenbivia, R. & Carvajal, E., 2008. p. 3)
En la parte izquierda de la aplicación se establecen los parámetros del Índice que se desea graficar, así como el número de fuentes. Para este ejemplo se graficaran los cuatro índices con un número de 20 fuentes.
LA VARIABLE SOURCES
42
Índice H Índice G
LA VARIABLE SOURCES
43
Índice M Total de citas
LA VARIABLE SOURCES
44
Tabla con todos la valores de las gráficas
LA VARIABLE AUTHORS
45
La siguiente variable se refiere a los Autores en la cual se puede obtener información respecto a: Relevancia por artículos publicados, Autores más citados, Producción en el tiempo, Ley le Lotka, Impacto de los autores, relevancia de las afiliaciones, Relación de autores por países, Producción científica por país y los países más citados. Para este ejemplo tomaremos algunas opciones.
LA VARIABLE AUTHORS
46
En la primera opción de ésta se observa los autores más relevantes por número de artículos publicados. Igual que en las opciones anteriores se muestra gráfica y la tabla correspondiente que se pueden descargar según la necesidad.
LA VARIABLE AUTHORS
47
Otra de las opciones relevantes en esta variable es la Ley de Lotka que se refiere a la distribución de los autores según su productividad.
La Ley de Lotka expresa, que el mayor número de autores publican el menor número de trabajos, mientras que el menor número de autores publica un mayor número de trabajos, siendo este el grupo más prolífico. (EcuRed, 2020)
LA VARIABLE AUTHORS
48
LA VARIABLE AUTHORS
49
Continuando con esta variable de los autores, se muestra a continuación las Afiliaciones por Autor más relevantes.
En este ejemplo es evidente ver como La Universidad de La Salle es la que más publicaciones tiene pues se está haciendo el estudio de dicha Institución.
LA VARIABLE AUTHORS
50
La siguiente y última opción de esta variable que se mostrará para este ejemplo es la Producción Científica por Países.
LA VARIABLE AUTHOR
51
Esta opción muestra un mapamundi en el cual se resaltan en color azul los países que han tenido producción científica según el dataset que se haya descargado de la base de datos. Cuanto más oscuro es el color azul, en este caso, más producción científica tiene el país.
LA VARIABLE DOCUMENTS
52
La Variable que se observa a continuación presenta características de los Documentos contenidos en el conjunto de datos descargados. En esta categoría se puede observar el Documento más citado por año o con el total de citas a nivel global, el Documento más citado por año o con el total de citas a nivel local, las referencias más citadas, Espectroscopia del año de publicación de la referencia;
y en esta misma variable se pueden observar algunas características de las palabras clave y palabras con más concurrencias en los documentos, de éstas palabras se puede observar: palabras más frecuentes en relación a Palabras Clave, en relación a Palabras de Autor, en relación al Título y en relación al Resumen; Con éstas palabras se puede realizar una nube de palabras que se parametriza según el gusto del usuario, un árbol de palabras, la dinámica de las palabras en el tiempo y por último las palabras tendencia.
53
LA VARIABLE DOCUMENTS
LA VARIABLE DOCUMENTS
53
Para esta guía se mostraran algunas de las opciones
Documentos más citados a nivel global Referencias más citadas a nivel local
LA VARIABLE DOCUMENTS
54
Nube de palabras Palabras tendencia en el tiempo
LA VARIABLE CONCEPTUAL STRUCTURE
55
Las siguientes tres variables que muestra la aplicación Bibliometrix se puede decir que son de un nivel muy avanzado en los estudio bibliométricos. Para esta guía se mostraran algunas opciones de cada variable dejando la salvedad que para un conocimiento a fondo de estas opciones es necesario la profundización de cada tema en relación a la bibliometría.
Esta variable se trata de la Estructura Conceptual en relación a los documentos que se han descargado en el dataset. Las categorías que se pueden trabajar en esta variable al igual que en algunas anteriores son las Palabras Clave, Palabras Clave de Autor, el título y el Abstrac.
LA VARIABLE CONCEPTUAL STRUCTURE
56
La primera opción de esta variable Estructura Conceptual es una Red de Co-Ocurrencias que hace referencia a una interconexión agrupada de términos, teniendo en cuenta su presencia en los documentos recuperados en la búsqueda inicial en Scopus. Estas redes se generan interconectando los términos de acuerdo a un conjunto de criterios de Co-Ocurrencias que se pueden parametrizar en la parte izquierda de la vista de la aplicación.
LA VARIABLE CONCEPTUAL STRUCTURE
57
Otra de las opciones de la misma variable es la Evolución Temática que hace un rastreo de al relación de las palabras clave, en este caso, en el periodo de tiempo registrado en las publicaciones. Igual que otras opciones se puede parametrizar de acuerdo con el gusto del analista.
LA VARIABLE INTELLECTUAL STRUCTURE
58
Otra de las últimas variables es la Estructura Intelectual que muestra una Red de co-citación de los diferentes artículos obtenidos en el dataset, la gráfica se puede parametrizar por autores, artículos o fuentes.
En este ejemplo se muestra la gráfica de co-citación por autores.
LA VARIABLE SOCIAL STRUCTURE
59
Por último está la variable Estructura Social que se refiere a las colaboraciones entre autores, países e instituciones.
La primera opción que presenta esta variable es Red de Colaboración. Para este ejemplo se grafica la colaboración entre las instituciones
LA VARIABLE SOCIAL STRUCTURE
60
La segunda opción de la misma variable es un Mapa Mundial de Colaboración entre países
Bibliometrix (2020). Bibliometrix 3.0 is out!. https://bibliometrix.org/
Rstudio (2020). Rstudio Connect 1.8.4. https://rstudio.com/
61
Referencias
GraciasEsta guía fue compilada por Henry Vargas Pacheco
Para mayor información escribe al correo: [email protected]
Iconos y gráficos: https://www.flaticon.com/http://www.slidescarnival.com/es
62Este material es propiedad de la Universidad de La Salle