SciELO - Scientific Electronic Library Online

 
vol.10 número1Fortalezas y debilidades de las principales bases de datos de información científica desde una perspectiva bibliométricaLa investigación argentina sobre agroindustria y su colaboración internacional (2007-2016) índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

  • No hay articulos citadosCitado por SciELO

Links relacionados

  • No hay articulos similaresSimilares en SciELO

Compartir


Palabra clave

versión On-line ISSN 1853-9912

Palabra clave vol.10 no.1 Ensenada oct. 2020

http://dx.doi.org/https://doi.org/10.24215/18539912e102 

Dossier Estudios métricos de la información: abordajes teóricos, metodológicos y empíricos

Evolución y alcance multidisciplinar de tres técnicas de análisis bibliométrico

Evolution and multidisciplinary scope of three bibliometric analytical techniques

1Universidad Nacional Autónoma de México. Centro de Ciencias de la Complejidad, México.

2Empresa de Tecnologías de la Información de BioCubaFarma, Cuba.

3Universidad Nacional Autónoma de México. Centro de Ciencias de la Complejidad y Facultad de Ciencias, México.

Resumen

Objetivo: el presente estudio tiene como objetivo analizar el comportamiento de la producción científica sobre tres técnicas de análisis bibliométrico: la co-citación, el acoplamiento bibliográfico y la co-ocurrencia de términos. Metodología: se utiliza Web of Science como fuente de datos. Se emplean medidas de productividad e impacto para caracterizar el comportamiento de la aplicación de cada técnica. Se proponen dos nuevos índices para determinar el alcance multidisciplinar de las investigaciones, y se complementan con el análisis documental para interpretar los resultados y establecer los marcos referenciales. Resultados: se identifican los autores, instituciones y países líderes, así como la cantidad de publicaciones seriadas donde se difunden las investigaciones, y las categorías temáticas del Web of Science donde éstas están clasificadas. Se evidenció la creciente evolución de la literatura que utiliza estas técnicas para la representación y análisis de dominios del conocimiento. Los dominios tecnológicos predominaron en los núcleos temáticos de producción, aunque en los núcleos temáticos de citación también hubo presencia de los entornos biomédicos, económicos y sociales. Conclusiones: la existencia de un núcleo altamente productivo de instituciones y países evidencia la sostenida aplicación intensiva y extensiva de estas técnicas, ante el reconocimiento comunitario mundial de su importancia y validez. Los indicadores propuestos permitieron identificar el carácter multidisciplinar y la naturaleza interdisciplinar de la producción científica relacionada con estas técnicas analíticas. Además, se visibiliza la influencia de las metrías y sus técnicas al trascender los límites del dominio de conocimiento que las originó, desde propuestas teóricas y meta-teóricas hacia múltiples espacios disciplinarios.

Palabras clave Bibliometría; Análisis de co-citación; Acoplamiento bibliográfico; Análisis de co-palabras; Multidisciplinariedad

Abstract

Objective: the current study aims to analyze the behavior of scientific production on three bibliometric analysis techniques: co-citation, bibliographic coupling, and terms co-occurrence. Methodology: the Web of Science is used as data source. Productivity and impact measures are used to characterize the behavior of each technique practices. Two new indices to determine the multidisciplinary scope of research are proposed, which are complemented by documentary analysis to interpret the results and establish the reference frameworks. Results: the leading authors, institutions and countries are identified, as well as the number of serial publications where the research was disseminated, and the Web of Science subject categories where they are classified. The growing evolution of the literature that uses these techniques for the representation and analysis of knowledge domains was evidenced. The technological domains predominated in the thematic production core, although in the thematic citations core there was also the presence of biomedical, economic and social environments. Conclusions: the existence of a highly productive core of institutions and countries evidences the sustained, intensive and extensive use of these techniques, given the global community recognition of their importance and validity. The proposed indicators allowed to identify the multidisciplinary and interdisciplinary nature of the scientific production related to these analytical techniques. In this way, the influence of metrics and their techniques is made visible, which transcend the limits of the knowledge domain that originated them, from theoretical and meta-theoretical proposals through multiple disciplinary spaces.

Keywords Bibliometrics; Co-citation analysis; Bibliographic coupling; Co-word analysis; Multidisciplinarity

1. Introducción

Las estrategias de búsqueda desplegadas, y posteriormente refinadas, permitieron analizar un total de 1.309 registros relacionados con técnicas de co-citación, 292 con técnicas de apareo bibliométrico y 1.244 con técnicas de co-ocurrencia de términos. La Figura 1 muestra la evolución por décadas de la literatura que ha utilizado estas tres técnicas desde su creación hasta el año 2019, observándose un comportamiento creciente y una explosión de artículos durante la última década.

Las metrías, como subdisciplinas instrumentales de las ciencias de la información, han contribuido de manera decisiva al desarrollo de nuevas metodologías para la organización y representación del conocimiento. Consecuentemente, cualquier análisis de un dominio del conocimiento tiene en cuenta el potencial de los estudios métricos como enfoque, método o herramienta para la caracterización y exposición de las conexiones entre documentos individuales (Hjorland, 2002). Estas conexiones van a representar el reconocimiento explícito de dependencia a un campo de investigación, o a una determinada posición epistemológica. De hecho, las ciencias de la información como conjunto de disciplinas informacionales, tiene en los estudios métricos uno de los principales componentes de su estructura intelectual, lo cual ha sido demostrado en investigaciones aplicadas realizadas por diferentes autores durante los últimos 30 años (Åström, 2007; Persson, 1994; Vega-Almeida, 2010; White y McCain, 1998; Yan Han, Wolfram y Zhao, 2016; Zhao y Strotmann, 2008, 2020).

Dentro de las disciplinas métricas, el análisis de citas constituye uno de los pilares sobre los que se sostiene gran parte de la investigación (Nicolaisen, 2007). Los estudios bibliométricos evaluativos y descriptivos, bajo esta perspectiva, están influenciados por corrientes sociológicas de enfoque normativo o estructuralista que reflexionan en torno a la idea de la cita como instrumento para la evaluación y caracterización de dominios del conocimiento (De Bellis, 2009). En contraposición, otros enfoques de tipo constructivista reflejan el carácter subjetivo de la cita como criterio evaluativo (MacRoberts y MacRoberts, 2018), e incorporan nuevas perspectivas de análisis. Cada uno de estos enfoques ha generado diferentes técnicas de análisis bibliométrico, con el objetivo de ser utilizadas en el proceso constructivo y reconstructivo de la historiografía de la ciencia, y la identificación de líneas de investigación en conjuntos de registros bibliográficos.

Dos técnicas resaltan entre las propuestas derivadas del Análisis de Citas: el apareo o acoplamiento bibliográfico, propuesto por M. M. Kessler (1963); y el análisis de la co-citación, creado simultáneamente por el también estadounidense Henry Small, en el Instituto de Información Científica (ISI) de Filadelfia, y la investigadora Irina Marshakova, del Instituto de Información Científico Técnica (VINITI) de la otrora Unión Soviética (Marshakova, 1973; Small, 1973).

La propuesta de Kessler (1963) parte del principio de que dos documentos estan estrechamente relacionados en la medida en que poseen una mayor cantidad de referencias bibliográficas en común. De esta forma, a partir del procesamiento automático de un conjunto de artículos, el acoplamiento bibliográfico se convierte en un criterio de interrelación que permite la obtención de grupos de artículos con un alto grado de similaridad, los cuales constituyen un frente de investigación (Persson, 1994; Zhao y Strotmann, 2015). La utilización de múltiples elementos de la referencia (documentos, autores, revistas, palabras en el título) como base para el acomplamiento bibliográfico, ha ampliado el alcance de esta técnica y su fácil despliegue en programas de cómputo reconocidos internacionalmente, entre los que se destacan CiteSpace o VOSviewer.

Por su parte, el análisis de co-citación también asume la literatura científica, y particularmente su aparato referencial, como configurador y reflejo de los patrones de comportamiento de la comunidad disciplinaria (Vega-Almeida, 2010). En este caso, los documentos que forman parte del listado de referencias de un tercero (o cualquiera de sus unidades de análisis: documentos, autores, revistas, categoría temática a la que pertenece la revista), comparten una relación de co-citación que vincula, de manera directa, los contenidos y conceptos que expresan. La vinculación crece cuanto mayor es la frecuencia en la que ambos trabajos son co-citados por otros documentos. Así, el procesamiento automático de un conjunto de artículos siguiendo este criterio, permite la obtención de grupos de trabajos conceptualmente relacionados, que constituyen la base o estructura intelectual del dominio objeto de investigación (De Bellis, 2009; Persson, 1994; Zhao y Strotmann, 2015).

El objetivo de ambas técnicas, al estudiar determinados contextos en series temporales, es mostrar que la literatura se cohesiona y transforma de manera inteligible en el tiempo (White y Griffth, 1981), en ese proceso que asegura, además, la unidad y coherencia que legitima y establece los elementos identitarios del campo de conocimiento. Su utilización, de conjunto con técnicas computacionales de ordenamiento o reducción y métodos de análisis de redes sociales (ARS), ha sido génesis de dominios temáticos como la Visualización de Información, y ha permitido la construcción de mapas de la ciencia de naturaleza bibliométrica. En este contexto, Small (2003) consideró que los artículos altamente citados tienen una significación simbólica especial para los autores citantes -nuevos descubrimientos, métodos, ideas. Por tal razón, definió los documentos citados como símbolos conceptuales más potentes que las palabras para el establecimiento de relaciones cognitivas (Small, 1973, 2003).

Los representantes del constructivismo social, sobre la base de la Teoría del Actor Red de Bruno Latour (Latour, 2011), asumieron una posición crítica y antagónica con respecto a las anteriores, y definieron un campo paradigmático o frente de investigación como el conjunto de términos que co-ocurren frecuentemente en un conjunto de registros bibliográficos (Callon, Courtial, Turner. y Bauin, 1983; Chalavarias y Cointet, 2008; Rip y Courtial, 1984). Esta posición, que asume la invalidez del análisis de citas como técnica, concibe la ciencia como un proceso social, en el que las citaciones constituyen un instrumento retórico para persuadir o convencer al resto de los científicos, además de que arrastran limitaciones importantes derivadas de los múltiples motivos que pueden generar una cita bibliográfica (MacRoberts y MacRoberts, 2018). De esta forma, surgió el análisis de la co-ocurrencia de términos como nueva técnica bibliométrica (Callon et al., 1983), partiendo del supuesto de que la co-ocurrencia de palabras, pares de términos o lexemas en un corpus de documentos refleja la conexión lógica que existe entre ellos, idea explícita en Small (Small, 2003). La intensidad en la frecuencia de la co-ocurrencia de un grupo de términos, determina la existencia de un frente de investigación, problema común o tema de actualidad en el dominio analizado (Olmeda-Gómez, Ovalle-Perandones y Perianes Rodríguez, 2017).

La comunidad científica vinculada a los estudios métricos de la información, a partir del surgimiento de estas técnicas, se ha focalizado en su aplicación para el estudio de muy diversos temas de investigación, la evaluación de sus características, y el desarrollo de soluciones híbridas, de cuya imbricación se pretende obtener mapas bibliométricos más objetivos y con menos limitaciones (Glänzel, 2012; Zhao y Strotmann, 2015). Sin embargo, pocos investigadores se han dedicado a caracterizar o evaluar la evolución de su utilización en entornos altamente especializados (Boyack y Klavans, 2010; Morris, 2005), y el alcance multidisciplinar de las investigaciones donde estas han sido aplicadas.

El presente trabajo tiene como objetivo analizar el comportamiento de la producción científica dedicada al estudio o aplicación de las técnicas de co-citación, acoplamiento bibliográfico y co-ocurrencia de términos, a partir de fuentes de información de máxima visibilidad internacional. Particularmente, se hace énfasis en el estudio de la distribución temática de estas investigaciones.

2. Metodología

Se utilizó como fuente de información primaria el Web of Science TM (WoS), desarrollado por Clarivate Analytics. La búsqueda incluyó todos los índices de citas comprendidos en la colección núcleo (Core Collection) de esta base de datos, disponible a través de la biblioteca digital de la Universidad Nacional Autónoma de México (UNAM). Los registros fueron recuperados el 1ro de agosto de 2020.

Se utilizaron las siguientes estrategias de búsqueda para la recuperación de los registros bibliográficos objeto de análisis:

Tabla 1 Estrategias de búsqueda y selección de registros a procesar 

Fuente: elaboración propia a partir de datos del WoS.

Los registros recuperados correspondientes a cada técnica analizada fueron refinados, excluyendo de las muestras el año 2020. De igual forma, se selecionaron para el análisis los siguientes tipos de documentos: artículos de investigación, artículos de revisión, trabajos publicados en actas de congresos y capítulos de libros.

Se estudió el comportamiento anual de la investigación que ha utilizado las tres técnicas analíticas. Se caracterizó la investigación relacionada con cada técnica a partir de los siguientes elementos:

  • Promedio de autores por artículo.

  • Cantidad de publicaciones seriadas.

  • Cantidad de países, y países más productivos.

  • Instituciones más productivas.

  • Cantidad de categorías temáticas del WoS que cubren la producción relativa a cada técnica.

El análisis del alcance multidisciplinar de las investigaciones requirió el desarrollo de los siguientes indicadores, derivados del esquema de clasificación de revistas del WoS:

  • Índice de concentración temática de la producción científica (CTp): Medida que expresa el núcleo o número mínimo de categorías temáticas del WoS que recogen aproximadamente el 80 % (pCore) de un conjunto de artículos.

  • Índice de concentración temática de la citación (CTc): Medida que expresa el núcleo o número mínimo de categorías temáticas del WoS que recogen aproximadamente el 80 % (cCore) de los documentos que citan a un conjunto de artículos.

Se empleó el análisis documental como técnica que complementa el estudio métrico, al contribuir con la explicación e interpretación de los resultados, así como al establecimiento de los marcos referenciales. Se utilizó el programa Microsoft Excel para la representación visual de los resultados obtenidos.

3. Resultados y discusión

Las estrategias de búsqueda desplegadas, y posteriormente refinadas, permitieron analizar un total de 1.309 registros relacionados con técnicas de co-citación, 292 con técnicas de apareo bibliométrico y 1.244 con técnicas de co-ocurrencia de términos. La Figura 1 muestra la evolución por décadas de la literatura que ha utilizado estas tres técnicas desde su creación hasta el año 2019, observándose un comportamiento creciente y una explosión de artículos durante la última década.

Figura 1 Evolución por décadas de la producción científica 

Fuente: elaboración propia a partir de datos del WoS.

El crecimiento durante los últimos diez años ha sido estable. A partir del 2012, con el desarrollo de nuevos métodos y herramientas para la minería de textos y la emergencia del análisis de grandes volúmenes de datos, el análisis de la co-ocurrencia de términos pasó a ocupar una posición de liderazgo. Durante este período, la emergencia de investigaciones que desarrollan redes dinámicas de co-palabras se hizo evidente (Katsurai y Ono, 2019; Wang, Cheng y Lu, 2014; Zhang et al., 2017). No obstante, en el año 2019 nuevamente la co-citación fue la técnica más utilizada por los investigadores.

Figura 2 Evolución anual de la producción científica durante el período 2010-2019 

Fuente: elaboración propia a partir de datos del WoS.

Como puede observarse, la co-citación y la co-ocurrencia de términos ostentaron los mayores valores en cuanto a volumen de producción e impacto (Tabla 2). Si bien se alcanzó una importante cantidad de artículos en el caso de la co-citación, la co-ocurrencia de términos se divulgó en una mayor cantidad de revistas, y estas abarcaron a su vez un número cada vez creciente de categorías temáticas. De igual forma, la cantidad de países participantes se distinguió en la investigación que analizó o aplicó técnicas de co-ocurrencia de términos (Tabla 3).

Los estudios que aplicaron técnicas de co-citación exhibieron un mayor índice H, y un promedio de 25 citas por cada artículo publicado, superior al resto. El volumen de citas recibidas y artículos citantes duplicó, en el caso de la co-citación, lo alcanzado por la investigación relacionada con el análisis de términos. El índice de asociatividad se aproximó a los tres autores por artículo en cada caso. En las tres técnicas, las categorías temáticas a las que pertenecieron los artículos citantes superaron el 75% de la cobertura temática del WoS, por lo que el alcance temático de las investigaciones ha sido sumamente amplio. El acoplamiento bibliográfico fue la técnica menos utilizada. Sin embargo, su promedio de citas por artículo superó al de la co-ocurrencia de términos.

Tabla 2 Comportamiento de indicadores usados para caracterizar las técnicas analíticas 

Fuente: elaboración propia a partir de datos del WoS.

China, Estados Unidos y España se encuentran entre los cuatro países más productores de acuerdo con cualquiera de las técnicas utilizadas (Tabla 3).

Tabla 3 Principales países que aplican cada técnica analítica 

Fuente: elaboración propia a partir de datos del WoS.

La co-citación ha sido fundamentalmente aplicada por investigadores chinos y norteamericanos. Los trabajos más relevantes liderados por autores chinos han sido investigaciones aplicadas, que han utilizado técnicas de co-citación para el estudio de determinados campos temáticos, como la gestión de riesgos en cadenas de suministros (Tang y Musa, 2011), la investigación sobre redes sociales (Shiau, Dwivedi y Yang, 2017) o la literatura sobre asociaciones público-privadas (Song, Zhang y Dong, 2016), entre otros múltiples temas. La Facultad de Gestión de Información de la Universidad de Wuhan y el WISE Lab de la Universidad Tecnológica de Dalian lideran las investigaciones del gigante asiático (Tabla 4).

Los principales aportes de los Estados Unidos, además de los trabajos fundacionales, han estado vinculados al desarrollo de metodologías y herramientas para el mapeo de dominios del conocimiento (Boyack, Klavans y Borner, 2005; Chen, 2006; White y McKain, 1998). Relevantes figuras de los estudios métricos de la información se han especializado en esta técnica, como Henry Small (Clarivate), Howard White y Katherine McKain (Universidad de Drexel), todos galardonados con la medalla Dereck De Solla Price que otorga la Sociedad Internacional de Cienciometría e Informetría (ISSI); de conjunto con investigadores activos de reconocida trayectoria, como Richard Klavans y Kevin Boyack (SciTech Strategies Inc), Katy Borner (Universidad de Indiana), y especialmente Chaomei Chen, creador del programa CiteSpace, quien lidera las investigaciones en la Universidad de Drexel, la institución más productiva en materia de técnicas de co-citación (Tabla 4).

Las Universidades de Granada y Valencia ocupan posiciones cimeras en la investigación española, donde destacan autores como Enrique Herrera Viedma y Félix de Moya Anegón, este último líder del Grupo SciMago, con importantes aportes en materia de mapeo de dominios del conocimiento. José María Merigó Lindahl, profesor del Departamento de Sistemas de Información y Auditoría de la Universidad de Chile, fue el autor más productivo en la aplicación de esta técnica, y el principal exponente por Latinoamérica. Otros relevantes expertos son el holandés Loet Leydesdorff (Universidad de Leiden) y el sueco Olle Persson (Universidad de Umea), innovadores en el desarrollo de herramientas para el procesamiento y análisis de citas bibliográficas; así como el binomio canadiense Dangzhi Zhao / Andreas Strotmann (Universidad de Alberta), con sus aportes al aparato metodológico (Tabla 4).

Tabla 4 Principales instituciones que aplican cada técnica analítica 

Fuente: elaboración propia a partir de datos del WoS.

Desde la dimensión metodológica, las técnicas de co-citación han evolucionado a lo largo del período de estudio, y se han ido incorporando nuevos enfoques analíticos, orientados fundamentalmente a la caracterización de dominios. La obtención de estructuras intelectuales derivadas de las relaciones existentes entre los elementos que componen las referencias bibliográficas, tuvo en el Análisis de co-citación de documentos (DCA, por sus siglas en inglés), su primer desarrollo (Small, 1973). Con posterioridad, se incorporó a su arsenal el Análisis de co-citación de autores (ACA, por sus siglas en inglés) (White y Griffith, 1981), con el cual Howard White y Katherine McKain mapearon la base intelectual de las ciencias de la información (White y McCain 1998). Y en la siguiente década, se propone el Análisis de Co-citación de Revistas (JCA) (McCain, 1991), con el cual diversos autores, entre ellos Loet Leydesdorff y la propia Katherine McKain, han intentado analizar fenómenos relacionados con la interdisciplinariedad y la transdisciplinariedad (Leydesdorff y Rafols, 2011; McCain y Whitney, 1994).

El siglo XXI se ha distinguido en este contexto, porque la co-citación de autores ha experimentado innovaciones derivadas de la observación de Persson (2001), quien estimó necesario contemplar en el análisis a todos los autores de los documentos citados, y no solo al primer autor, como hasta entonces fue la práctica por limitaciones de la base de datos. Sobre este enfoque, diferentes autores enriquecieron la técnica analítica, no solo contemplando el total de autores citados, sino también incorporando nuevas técnicas de análisis multivariado para representación de la estructura intelectual (Eom, 2008; Zhao y Strotmann, 2008a). Por su parte, investigadores del Grupo SciMago (España) se basaron en el esquema de clasificación de revistas del WoS, y propusieron una técnica para mapear dominios del conocimiento a partir de la co-citación de clases y categorías temáticas (Moya-Anegón et al., 2004).

En el presente estudio, el esquema de clasificación de revistas del WoS fue utilizado para analizar el alcance multidisciplinar de la investigación que involucró las técnicas de co-citación. En este sentido, las 787 publicaciones seriadas donde se difundieron estos estudios, abarcaron 142 categorías temáticas, que representan el 56 % del total de categorías identificadas en el esquema de clasificación (Tabla 2). Al mismo tiempo, los 20.375 artículos que citaron al menos una vez alguno de los 1.309 artículos analizados, fueron cubiertos por 235 categorías temáticas (92,2 %). Si embargo, los nuevos índices que se presentan en la investigación, a partir de un enfoque basado en el principio de Pareto, permitieron analizar la dimensión multidisciplinar por los núcleos temáticos que concentran el 80% de la producción y la citación (Figura 3).

Figura 3 Composición del núcleo temático de la producción y la citación en la producción científica relacionada con técnicas de co-citación 

Fuente: elaboración propia a partir de datos del WoS.

Así, el mayor volumen de producción científica sobre técnicas de co-citación abarcó 16 categorías temáticas. Un tercio de ellos se diseminaron en revistas del dominio origen (ciencia de la información y bibliotecología), y el resto se distribuyó en cinco categorías temáticas relacionadas con las ciencias de la computación, tres categorías del área de la gestión, tres categorías de ciencias ambientales, dos categorías de ingeniería, y una percápita en las áreas de educación y economía. Por su parte, el núcleo temático que concentró los artículos citantes abarcó un número mayor de categorías temáticas (24). La proporción del dominio origen fue menor (19 %). Las 16 categorías presentes en la producción también se identificaron en el núcleo de citación, y se incorporaron ocho categorías temáticas: dos nuevas ingenierías, una ciencia social, y áreas tan disímiles como la biotecnología y microbiología aplicada, planificación urbana regional, telecomunicaciones, ocio hotelero-deporte-turismo, y la categoría que cubre las revistas de alcance multitemático. La baja proporción en ambos casos del dominio origen, la nutrida composición de los núcleos temáticos, y la diversidad temática observada en ellos, manifiestan el alcance multidisciplinar de los estudios métricos de la información, y particularmente, de la literatura sobre técnicas de co-citación; así como su naturaleza interdisciplinar.

A pesar de su utilidad, el acoplamiento bibliográfico ha sido la técnica menos utilizada entre las estudiadas en la presente investigación. Sin embargo, fue demostrada la mayor precisión de su enfoque para el mapeo bibliométrico (Boyack y Klavans, 2010), causa que puede estar influyendo en el crecimiento sostenido desde el año 2010. Tradicionalmente, la técnica se limitaba a agrupar conjuntos de documentos a partir de los artículos citados. Sin embargo, diversos autores han introducido innovaciones que permiten el uso para el acoplamiento de diversos elementos de la referencia, como el análisis del acoplamiento bibliográfico de autor (author bibliographic-coupling analysis, ABCA) (Zhao y Strotmann, 2008b), el acoplamiento autor descriptor (author keyword coupling analysis, AKCA) (Yang et al., 2016), o del título de las revistas (Boyack, Börner y Klavans, 2009). Durante los últimos años, se ha consolidado el uso de métodos híbridos, basados en acoplamientos bibliográficos y minería de textos (Glänzel, 2012; Meyer-Brötz et al., 2018; Thijs, Schiebel y Glänzel, 2013).

Estados Unidos lidera la investigación que emplea esta técnica para la determinación de frentes de investigación en un dominio (Tabla 3). El Instituto Tecnológico de Georgia, la compañía Clarivate y la Universidad de Indiana (Campus Bloomington) son las mayores instituciones productoras de Norteamérica. Autores como el emblemático Eugene Garfield, fundador del Instituto de Información Científica (ISI) de Filadelfia, Richard Klavans, Kevin Boyack (SciTech Strategies Inc), Steven A. Morris (Baker-Hughes Inc) y Alan L. Porter (Instituto Tecnológico de Georgia) destacan entre los principales ejecutores de la técnica. China es el segundo mayor productor, con la Universidad Tecnológica de Beijing y la Facultad de Gestión de Información de la Universidad de Wuhan entre las instituciones líderes; seguido de España, que tuvo en la Universidad de Barcelona su principal exponente (Tabla 4).

La Universidad de Chile, nuevamente a través del autor José María Merigó Lindahl, fue la institución más productiva. La Universidad Nacional de Taiwán y la Universidad Católica de Leuven (Bélgica) le siguieron en ese orden, lideradas ambas por los investigadores Mu-Hsuan Huang y Wolfgang Glänzel; este último, uno de los principales exponentes de los estudios métricos de la información en Europa. Investigadores especializados en técnicas híbridas, como el belga Bart Thijs (Universidad Católica de Leuven), el austriaco Edgar Schiebel (Instituto Tecnológico de Austria) y el sueco Bo Jarvening (Universidad de Gotemburgo), completaron el grupo de autores significativos (Tabla 4).

La producción científica que aplicó técnicas de acoplamiento bibliográfico se difundió en 155 publicaciones seriadas, que abarcaron solo 64 categorías temáticas (25 % del total), muy por debajo de las otras técnicas (Tabla 2). No obstante, los 4.173 artículos que citaron al menos una vez alguno de los 292 artículos estudiados, fueron cubiertos por 194 categorías temáticas (76 %), lo que indicó una influencia que rebasa con creces los marcos disciplinarios. Este comportamiento fue evidenciado cuando se analizó el núcleo que concentra el 80 % de la producción y la citación.

Solo cinco categorías abarcaron el 80 % de la producción científica relacionada con técnicas de acoplamiento bibliográfico. La mitad de ellos se publicaron en revistas del dominio origen (ciencia de la información y bibliotecología), y el resto se distribuyó en dos categorías temáticas relacionadas con las ciencias de la computación, y dos categorías del área de la gestión. Sin embargo, el núcleo temático que concentró los artículos citantes triplicó el número de categorías temáticas (17). La proporción del dominio origen fue de un 35 %; las 5 categorías presentes en la producción también se identificaron en el núcleo de citación, y en el mismo orden; y se incorporaron 12 categorías temáticas: cuatro relacionadas con las ciencias físicas y la ciencia de materiales, tres con la ciencia ambiental, dos con las ciencias de la computación, una ciencia social, una ingeniería, y la categoría dedicada a revistas multidisciplinarias. Si bien la investigación ha focalizado su diseminación en revistas de la especialidad, la composición temática del núcleo de citación refleja la influencia que ha tenido la aplicación de técnicas de acoplamiento bibliométrico sobre otros dominios del conocimiento. De hecho, contrasta esa proyección tan disciplinar, con el alcance multidisciplinar y la naturaleza interdisciplinar que se manifiesta en la actividad de citación.

Figura 4 Composición del núcleo temático de la producción y la citación en la producción científica relacionada con técnicas de acoplamiento bibliográfico 

Fuente: elaboración propia a partir de datos del WoS.

La técnica de co-ocurrencia de términos, como se expuso anteriormente, ha tenido un especial desarrollo durante la última década analizada. Esto se ha debido, además de a los aportes que ha brindado la introducción de la inteligencia artificial y el aprendizaje automático a los procesos de minería de textos, a la inserción de la co-ocurrencia de palabras en metodologías híbridas para el mapeo de dominios del conocimiento (Glänzel, 2012). De los trabajos iniciales que concibieron la utilización de los descriptores y las palabras más frecuentes en el texto de los artículos para la construcción de los mapas (Callon et al., 1983; Rip & Courtial, 1984), a la utilización de los descriptores y palabras en el título o en los resúmenes de los artículos citantes (en lo que sería más bien una variante de co-citación), y el desarrollo de técnicas de Análisis de Semántica Latente (Leydesdorff y Welbers, 2011), el uso de los términos como criterio para la representación del conocimiento se ha consolidado.

China es el país que ha estado a la vanguardia en estas investigaciones, duplicando los estudios realizados por autores de los Estados Unidos. La participación de investigadores de su Academia de Ciencias en las investigaciones, y el liderazgo de instituciones como la Facultad de Recursos y Ciencia Ambiental de la Universidad de Wuhan, la Universidad de Pekin, y la Universidad Tecnológica de Dalian son notables. Song Hong (Universidad de Wuhan) es el más productivo de los autores chinos, con estudios bibliométricos y revisiones sistemáticas especialmente relacionados con la temática ambiental (Liu, Zhang y Hong, 2011), urbanización (Wang et al., 2012) y sistemas de información geográfica (Tian, Wen y Song, 2008; Zhuang et al., 2013) (Tabla 4).

La producción estadounidense ha estado muy diversificada, tanto a nivel institucional, autoral y temático, con amplia colaboración con instituciones chinas, y algún que otro acercamiento a la caracterización de la estructura cognitiva de la Ciencia de la Información (Milojević et al., 2011). Inglaterra fue el tercer mayor productor de artículos, con protagonismo de la Universidad de Londres, y de autores como John A. Bullinaria (Universidad de Birmingham) y Joseph P. Levy (Universidad de Roehampton), quienes han estudiado las posibilidades computacionales para formular y validar representaciones de significados de palabras a partir de estadísticas de co-ocurrencia de términos (Bullinaria y Levy, 2007, 2012); o como Clive Seale (Universidad de Londres) y Jonathan Charteris-Black (Universidad de West England) que aplicaron técnicas de análisis de descriptores en entornos web de temática biomédica (Seale et al., 2010; Seale, Ziebland y Charteris-Black, 2006).

España se mantuvo entre los principales productores, con una importante contribución del Departamento de Ciencias de la Computación e Inteligencia Artificial de la Universidad de Granada, que ha derivado en el Instituto Andaluz Interuniversitario sobre Ciencia de Datos e Inteligencia Computacional. Bajo el liderazgo de autores como Enrique Herrera-Viedma (Universidad de Granada) y Manuel Jesús Cobo (Universidad de Cádiz), los investigadores españoles han desarrollado métodos basados en co-ocurrencia de términos para detectar, cuantificar y visualizar la evolución de campos de investigación (Cobo et al., 2011; Cobo et al., 2015). Otros relevantes autores familiarizados con esta técnica, incluyen a los taiwaneses Hsin-Ning Su y Pei-Chun Lee, del Centro de Información e Investigación sobre Políticas de Ciencia y Tecnología. Por supuesto, este grupo de alta productividad también está integrado por los sociólogos franceses Jean Pierre Courtial y Michel Callon, que desde el Centro de Sociología de la Innovación de París crearon e impulsaron la técnica, hasta convertirla en una de las principales herramientas en el campo de los Estudios Métricos de la Información, con una notable utilización en otras disciplinas científicas.

De hecho, en el caso de la literatura que aplicó técnicas de co-ocurrencia de términos, se observó en el presente estudio la mayor actividad multidisciplinar entre las tres técnicas analizadas. Las 948 publicaciones seriadas que se utilizaron como vehículos de difusión, abarcaron 159 categorías temáticas, que representan el 62,4 % del total de categorías del esquema WoS (Tabla 2). De igual forma, los 10.804 artículos que citaron a los 1.244 artículos analizados, fueron cubiertos por 234 categorías temáticas (91,8 %). Por su parte, el análisis de los núcleos que concentran el 80 % de la producción y la citación, arrojó resultados que acentuaron ese carácter multidisciplinar de la investigación.

Un total de 19 categorías abarcaron el 80 % de la producción científica relacionada con técnicas de co-ocurrencia de términos. Solo un 22,7 % se situó en revistas del dominio origen (ciencia de la información y bibliotecología), y el resto se distribuyó en cinco categorías temáticas relacionadas con las ciencias de la computación, cuatro categorías de ciencias sociales (incluidas dos categorías de lingüística y comunicación), tres categorías de ciencia ambiental, dos categorías de gestión, además de las categorías telecomunicaciones y educación, lo que significó una mayor diversidad en el núcleo de producción con respecto a las otras dos técnicas analizadas.

En cuanto al núcleo temático que concentró los artículos citantes, este estuvo compuesto por 30 categorías temáticas, la mayor cifra alcanzada por cualquiera de las técnicas analizadas, a pesar de que los artículos citantes fueron mucho menos que en el caso de las técnicas de co-citación (Figura 5).

Figura 5 Composición del núcleo temático de la producción y la citación de la producción científica relacionada con técnicas de co-ocurrencia de términos 

Fuente: elaboración propia a partir de datos del WoS.

La distribución en este núcleo fue más homogénea, con una proporción del dominio origen de solo un 17 %. Una vez más, las categorías incluidas en el núcleo de producción estuvieron también representadas en el núcleo de citación, aunque se observó mayor movimiento en las posiciones y proporciones de estas categorías, la cual fue más evidente en las categorías ambientales. Además, se incorporaron otras once categorías a este núcleo: tres categorías de Ingeniería, tres categorías relacionadas con las ciencias médicas (no presentes en las otras dos técnicas), una categoría de gestión, y áreas como la planificación urbana regional, economía, energía y combustibles, y ocio hotelero-deporte-turismo. Por tanto, en el caso de la co-ocurrencia de términos, se acentuó el alcance multidisciplinar y la naturaleza interdisciplinar de las investigaciones.

Conclusiones

El análisis de los aportes de las técnicas de co-citación, acoplamiento bibliográfico y co-ocurrencia de términos en el presente trabajo evidenció la creciente evolución de la literatura que utiliza estas técnicas para la representación y análisis de dominios del conocimiento; técnicas cuya selección ha respondido a determinados espacios temporales, y a contextos concretos de desarrollo y demostración de robustez de las mismas. Esto no excluye la probabilidad de que esta selección pueda responder no solo a la asunción de presupuestos teóricos-metodológicos específicos, en correspondencia con el objetivo de las investigaciones, como expresión de posiciones epistemológicas; sino también a la facilidad de uso de algunas de ellas, o su frecuente uso, en detrimento de la aplicación de las más pertinentes en los estudios en cuestión.

La utilización de la colección núcleo del WoS, permitió acceder a la literatura con mayor visibilidad internacional, adscrita a la llamada “corriente principal” de la Ciencia, e identificar a los autores, instituciones y países que han liderado las investigaciones, tanto la que ha aportado elementos a su desarrollo metodológico, como la que ha aplicado las metodologías al estudio de los diversos campos del conocimiento. La existencia de un núcleo altamente productivo en cada técnica evidencia la sostenida aplicación intensiva y extensiva de las mismas, ante el reconocimiento comunitario a nivel mundial de su importancia y validez.

Los indicadores utilizados, permitieron identificar el carácter multidisciplinar y la naturaleza interdisciplinar de la producción científica relacionada con estas técnicas analíticas. La amplia distribución temática de estas investigaciones se puso de manifiesto a través de los índices de concentración de la producción y la citación, los cuales mostraron volumenes de producción multidisciplinarios (fundamentalmente en las técnicas de co-citación y co-ocurrencia de términos), y especialmente diversos en sus redes de influencia. Los dominios tecnológicos fueron los más analizados, aunque en los núcleos temáticos de citación también hubo presencia de entornos biomédicos, económicos y sociales. De esta manera, se visibiliza la influencia de las metrías y sus técnicas, las cuales trascienden los límites del dominio de conocimiento que las originó desde propuestas teóricas y meta-teóricas.

Estas técnicas, a su vez, contribuyen al examen crítico a partir de la identificación de las transformaciones que determinan el dinamismo y evolución de la estructura intelectual y social de la multiplicidad de campos de conocimientos y sus interdependencias, en relación recíproca con los factores contextuales espaciales y temporales.

Agradecimientos

Los resultados fueron obtenidos en el marco del proyecto “Cienciometría, Complejidad y Ciencia de la Ciencia”, del Centro de Ciencias de la Complejidad de la UNAM.

Referencias

Åström, F. (2007). Changes in the LIS research front: Time‐sliced cocitation analyses of LIS journal articles, 1990–2004. Journal of the American Society for Information Science and Technology, 58(7), 947-957. [ Links ]

Boyack, K. W., Börner, K. y Klavans, R. (2009). Mapping the structure and evolution of chemistry research. Scientometrics, 79(1), 45-60. [ Links ]

Boyack, K. W. y Klavans, R. (2010). Co-citation analysis, bibliographic coupling, and direct citation: Which citation approach represents the research front most accurately? Journal of the American Society for Information Science and Technology, 61(12), 2389-2404. [ Links ]

Boyack, K. W., Klavans, R. y Börner, K. (2005). Mapping the backbone of science. Scientometrics, 64(3), 351-374. [ Links ]

Bullinaria, J. A. y Levy, J. P. (2007). Extracting semantic representations from word co-occurrence statistics: A computational study. Behavior research methods, 39(3), 510-526. [ Links ]

Bullinaria, J. A. y Levy, J. P. (2012). Extracting semantic representations from word co-occurrence statistics: stop-lists, stemming, and SVD. Behavior research methods, 44(3), 890-907. [ Links ]

Callon, M., Courtial, J. P., Turner, W. A. y Bauin, S. (1983). From translation to network-The co-word analysis. Social science information, 22(2), 191-235. [ Links ]

Chalavarias, D. y Cointet, J. P. (2008). Bottom-up scientific field detection for dynamical and hierarchical science mapping, methodology and case study. Scientometrics, 75(1), 37-50. [ Links ]

Cobo, M. J., López-Herrera, A. G., Herrera-Viedma, E. y Herrera, F. (2011). An approach for detecting, quantifying, and visualizing the evolution of a research field: A practical application to the fuzzy sets theory field. Journal of informetrics, 5(1), 146-166. [ Links ]

Cobo, M. J., Martínez, M. Á., Gutiérrez-Salcedo, M., Fujita, H. y Herrera-Viedma, E. (2015). 25 years at knowledge-based systems: a bibliometric analysis. Knowledge-based systems, 80, 3-13. [ Links ]

De Bellis, N. (2009). Bibliometrics and citation analysis. Lanham, MD: Scarecrow. [ Links ]

Eom, S. (2008). All author cocitation analysis and first author cocitation analysis: a comparative empirical analysis. Journal of informetrics, 2(1), 53-64. [ Links ]

Glänzel, W. (2012). Bibliometric methods for detecting and analysing emerging research topics. El profesional de la información, 21(1), 194-201. [ Links ]

Hjorland, B. (2002). Domain analysis in Information Science: Eleven approaches traditional as well as innovative. Journal of the American Society for Information Science, 58(4), 422-462. [ Links ]

Katsurai, M. y Ono, S. (2019). TrendNets: mapping emerging research trends from dynamic co-word networks via sparse representation. Scientometrics, 121(3), 1583-1598. [ Links ]

Kessler, M. M. (1963). Bibliographic coupling extended in time: ten case histories. Information storage and retrieval, 1(4), 169-187. [ Links ]

Latour, B. (2011). Networks, societies, spheres: reflections of an actor-network theorist. International journal of communication, 5, 796-810. [ Links ]

Leydesdorff, L. y Rafols, I. (2011). Indicators of the interdisciplinarity of journals: Diversity, centrality, and citations. Journal of Informetrics, 5(1), 87-100. [ Links ]

Leydesdorff, L. y Welbers, K. (2011). The semantic mapping of words and co-words in contexts. Journal of informetrics, 5(3), 469-475. [ Links ]

Liu, X., Zhang, L. y Hong, S. (2011). Global biodiversity research during 1900–2009: a bibliometric analysis. Biodiversity and conservation, 20(4), 807-826. [ Links ]

MacRoberts, M. H. y MacRoberts, B. R. (2018). The mismeasure of science: Citation analysis. Journal of the Association for Information Science and Technology, 69(3), 474-482. [ Links ]

Marshakova, I. V. (1973). A system of document connection based on references. Scientific and technical information serial of VINITI, 6(2), 3-8. [ Links ]

McCain, K. W. (1991). Mapping economics through the journal literature: An experiment in journal cocitation analysis. Journal of the American Society for Information Science, 42(4), 290. [ Links ]

McCain, K. W. y Whitney, P. J. (1994). Contrasting assessments of interdisciplinarity in emerging specialties: The case of neural networks research. Knowledge, 15(3), 285-306. [ Links ]

Meyer-Brötz, F., Stelzer, B., Schiebel, E. y Brecht, L. (2018). Mapping the technology and innovation management literature using hybrid bibliometric networks. International Journal of Technology Management, 77(4), 235-286. [ Links ]

Milojević, S., Sugimoto, C. R., Yan, E. y Ding, Y. (2011). The cognitive structure of library and information science: Analysis of article title words. Journal of the American Society for Information Science and Technology, 62(10), 1933-1953. [ Links ]

Morris, S. A. (2005). Manifestation of emerging specialties in journal literature: A growth model of papers, references, exemplars, bibliographic coupling, cocitation, and clustering coefficient distribution. Journal of the American Society for Information Science and Technology, 56(12), 1250-1273. [ Links ]

Moya-Anegón, F., Vargas-Quesada, B., Herrero-Solana, V., Chinchilla-Rodríguez, Z., Corera-Álvarez, E. y Muñoz-Fernández, F. J. (2004). A new technique for building maps of large scientific domains based on the cocitation of classes and categories. Scientometrics, 61(1), 129-145. [ Links ]

Nicolaisen, J. (2007). Citation analysis. Annual review of information science and technology, 41(1), 609-641. [ Links ]

Olmeda-Gómez, C., Ovalle-Perandones, M. A. y Perianes-Rodríguez, A. (2017). Co-word analysis and thematic landscapes in Spanish information science literature, 1985–2014. Scientometrics, 113(1), 195-217. [ Links ]

Persson, O. (1994). The intellectual base and research fronts of JASIS 1986–1990. Journal of the American society for information science, 45(1), 31-38. [ Links ]

Persson, O. (2001). All author citations versus first author citations. Scientometrics, 50(2), 339-344. [ Links ]

Rip, A. y Courtial, J. (1984). Co-word maps of biotechnology: an example of cognitive scientometrics. Scientometrics, 6(6), 381-400. [ Links ]

Shiau, W. L., Dwivedi, Y. K. y Yang, H. S. (2017). Co-citation and cluster analyses of extant literature on social networks. International Journal of Information Management, 37(5), 390-399. [ Links ]

Seale, C., Charteris-Black, J., MacFarlane, A. y McPherson, A. (2010). Interviews and internet forums: a comparison of two sources of qualitative data. Qualitative health research, 20(5), 595-606. [ Links ]

Seale, C., Ziebland, S. y Charteris-Black, J. (2006). Gender, cancer experience and internet use: a comparative keyword analysis of interviews and online cancer support groups. Social science & medicine, 62(10), 2577-2590. [ Links ]

Small, H. (1973). Co‐citation in the scientific literature: A new measure of the relationship between two documents. Journal of the American Society for information Science, 24(4), 265-269. [ Links ]

Small, H. (2003). Paradigms, citations, and maps of science: A personal history. Journal of the American Society for Information Science and Technology, 54(5), 394-399. [ Links ]

Song, J., Zhang, H. y Dong, W. (2016). A review of emerging trends in global PPP research: analysis and visualization. Scientometrics, 107(3), 1111-1147. [ Links ]

Tang, O. y Musa, S. N. (2011). Identifying risk issues and research advancements in supply chain risk management. International Journal of production economics, 133(1), 25-34. [ Links ]

Thijs, B., Schiebel, E. y Glänzel, W. (2013). Do second-order similarities provide added-value in a hybrid approach? Scientometrics, 96(3), 667-677. [ Links ]

Tian, Y., Wen, C. y Hong, S. (2008). Global scientific production on GIS research by bibliometric analysis from 1997 to 2006. Journal of informetrics, 2(1), 65-74. [ Links ]

Vega-Almeida, R. L. (2010). Ciencia de la información y paradigma social: enfoque histórico, epistemológico y bibliométrico para un análisis de dominio (Tesis doctoral). Universidad de Granada, Granada. Recuperado de https://digibug.ugr.es/handle/10481/15418Links ]

Wang, H., He, Q., Liu, X., Zhuang, Y. y Hong, S. (2012). Global urbanization research from 1991 to 2009: a systematic research review. Landscape and urban planning, 104(3-4), 299-309. [ Links ]

Wang, X., Cheng, Q. y Lu, W. (2014). Analyzing evolution of research topics with NEViewer: a new method based on dynamic co-word networks. Scientometrics, 101(2), 1253-1271. [ Links ]

White, H. D. y Griffith B. C. (1981). Author co-citation: A literature measure of intellectual structure. Journal of American Society for Information Science, 32(3), 163-172. [ Links ]

White, H. D. y McCain, K. (1998). Visualizing a discipline: An author co-citation analysis of Information Science, 1972-1995. Journal of the American Society for information Science, 49(4), 327-355. [ Links ]

Yang, S., Han, R., Wolfram, D. y Zhao, Y. (2016). Visualizing the intellectual structure of information science (2006–2015): introducing author keyword coupling analysis. Journal of informetrics, 10(1), 132-150. [ Links ]

Zhang, Q. R., Li, Y., Liu, J. S., Chen, Y. D. y Chai, L. H. (2017). A dynamic co-word network-related approach on the evolution of China’s urbanization research. Scientometrics, 111(3), 1623-1642. [ Links ]

Zhao, D., y Strotmann, A. (2008a). Evolution of research activities and intellectual influences in Informa-tion Science 1996-2005: Introducing author bibliographic coupling analysis. Journal of the American Society for Information Science and Technology, 59(13), 2070-2086. [ Links ]

Zhao, D. y Strotmann, A. (2008b). Comparing all-author and first-author co-citation analyses of Information Science. Journal of informetrics, 2(3), 229-239. [ Links ]

Zhao, D. y Strotmann, A. (2015). Analysis and visualization of citation networks. Synthesis lectures on information concepts, retrieval, and services, 7(1), 1-207. [ Links ]

Zhao, D. y Strotmann, A. (2020). Telescopic and panoramic views of library and information science research 2011–2018: a comparison of four weighting schemes for author co-citation analysis. Scientometrics, 124(1), 255-270. [ Links ]

Zhuang, Y., Liu, X., Nguyen, T., He, Q. y Hong, S. (2013). Global remote sensing research trends during 1991–2010: a bibliometric analysis. Scientometrics, 96(1), 203-219. [ Links ]

Recibido: 31 de Julio de 2020; Aprobado: 30 de Agosto de 2020; : 01 de Octubre de 2020

Creative Commons License Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.