1. Introducción
Las estrategias de búsqueda desplegadas, y posteriormente refinadas, permitieron analizar un total de 1.309 registros relacionados con técnicas de co-citación, 292 con técnicas de apareo bibliométrico y 1.244 con técnicas de co-ocurrencia de términos. La Figura 1 muestra la evolución por décadas de la literatura que ha utilizado estas tres técnicas desde su creación hasta el año 2019, observándose un comportamiento creciente y una explosión de artículos durante la última década.
Las metrías, como subdisciplinas instrumentales de las ciencias de la información, han contribuido de manera decisiva al desarrollo de nuevas metodologías para la organización y representación del conocimiento. Consecuentemente, cualquier análisis de un dominio del conocimiento tiene en cuenta el potencial de los estudios métricos como enfoque, método o herramienta para la caracterización y exposición de las conexiones entre documentos individuales (Hjorland, 2002). Estas conexiones van a representar el reconocimiento explícito de dependencia a un campo de investigación, o a una determinada posición epistemológica. De hecho, las ciencias de la información como conjunto de disciplinas informacionales, tiene en los estudios métricos uno de los principales componentes de su estructura intelectual, lo cual ha sido demostrado en investigaciones aplicadas realizadas por diferentes autores durante los últimos 30 años (Åström, 2007; Persson, 1994; Vega-Almeida, 2010; White y McCain, 1998; Yan Han, Wolfram y Zhao, 2016; Zhao y Strotmann, 2008, 2020).
Dentro de las disciplinas métricas, el análisis de citas constituye uno de los pilares sobre los que se sostiene gran parte de la investigación (Nicolaisen, 2007). Los estudios bibliométricos evaluativos y descriptivos, bajo esta perspectiva, están influenciados por corrientes sociológicas de enfoque normativo o estructuralista que reflexionan en torno a la idea de la cita como instrumento para la evaluación y caracterización de dominios del conocimiento (De Bellis, 2009). En contraposición, otros enfoques de tipo constructivista reflejan el carácter subjetivo de la cita como criterio evaluativo (MacRoberts y MacRoberts, 2018), e incorporan nuevas perspectivas de análisis. Cada uno de estos enfoques ha generado diferentes técnicas de análisis bibliométrico, con el objetivo de ser utilizadas en el proceso constructivo y reconstructivo de la historiografía de la ciencia, y la identificación de líneas de investigación en conjuntos de registros bibliográficos.
Dos técnicas resaltan entre las propuestas derivadas del Análisis de Citas: el apareo o acoplamiento bibliográfico, propuesto por M. M. Kessler (1963); y el análisis de la co-citación, creado simultáneamente por el también estadounidense Henry Small, en el Instituto de Información Científica (ISI) de Filadelfia, y la investigadora Irina Marshakova, del Instituto de Información Científico Técnica (VINITI) de la otrora Unión Soviética (Marshakova, 1973; Small, 1973).
La propuesta de Kessler (1963) parte del principio de que dos documentos estan estrechamente relacionados en la medida en que poseen una mayor cantidad de referencias bibliográficas en común. De esta forma, a partir del procesamiento automático de un conjunto de artículos, el acoplamiento bibliográfico se convierte en un criterio de interrelación que permite la obtención de grupos de artículos con un alto grado de similaridad, los cuales constituyen un frente de investigación (Persson, 1994; Zhao y Strotmann, 2015). La utilización de múltiples elementos de la referencia (documentos, autores, revistas, palabras en el título) como base para el acomplamiento bibliográfico, ha ampliado el alcance de esta técnica y su fácil despliegue en programas de cómputo reconocidos internacionalmente, entre los que se destacan CiteSpace o VOSviewer.
Por su parte, el análisis de co-citación también asume la literatura científica, y particularmente su aparato referencial, como configurador y reflejo de los patrones de comportamiento de la comunidad disciplinaria (Vega-Almeida, 2010). En este caso, los documentos que forman parte del listado de referencias de un tercero (o cualquiera de sus unidades de análisis: documentos, autores, revistas, categoría temática a la que pertenece la revista), comparten una relación de co-citación que vincula, de manera directa, los contenidos y conceptos que expresan. La vinculación crece cuanto mayor es la frecuencia en la que ambos trabajos son co-citados por otros documentos. Así, el procesamiento automático de un conjunto de artículos siguiendo este criterio, permite la obtención de grupos de trabajos conceptualmente relacionados, que constituyen la base o estructura intelectual del dominio objeto de investigación (De Bellis, 2009; Persson, 1994; Zhao y Strotmann, 2015).
El objetivo de ambas técnicas, al estudiar determinados contextos en series temporales, es mostrar que la literatura se cohesiona y transforma de manera inteligible en el tiempo (White y Griffth, 1981), en ese proceso que asegura, además, la unidad y coherencia que legitima y establece los elementos identitarios del campo de conocimiento. Su utilización, de conjunto con técnicas computacionales de ordenamiento o reducción y métodos de análisis de redes sociales (ARS), ha sido génesis de dominios temáticos como la Visualización de Información, y ha permitido la construcción de mapas de la ciencia de naturaleza bibliométrica. En este contexto, Small (2003) consideró que los artículos altamente citados tienen una significación simbólica especial para los autores citantes -nuevos descubrimientos, métodos, ideas. Por tal razón, definió los documentos citados como símbolos conceptuales más potentes que las palabras para el establecimiento de relaciones cognitivas (Small, 1973, 2003).
Los representantes del constructivismo social, sobre la base de la Teoría del Actor Red de Bruno Latour (Latour, 2011), asumieron una posición crítica y antagónica con respecto a las anteriores, y definieron un campo paradigmático o frente de investigación como el conjunto de términos que co-ocurren frecuentemente en un conjunto de registros bibliográficos (Callon, Courtial, Turner. y Bauin, 1983; Chalavarias y Cointet, 2008; Rip y Courtial, 1984). Esta posición, que asume la invalidez del análisis de citas como técnica, concibe la ciencia como un proceso social, en el que las citaciones constituyen un instrumento retórico para persuadir o convencer al resto de los científicos, además de que arrastran limitaciones importantes derivadas de los múltiples motivos que pueden generar una cita bibliográfica (MacRoberts y MacRoberts, 2018). De esta forma, surgió el análisis de la co-ocurrencia de términos como nueva técnica bibliométrica (Callon et al., 1983), partiendo del supuesto de que la co-ocurrencia de palabras, pares de términos o lexemas en un corpus de documentos refleja la conexión lógica que existe entre ellos, idea explícita en Small (Small, 2003). La intensidad en la frecuencia de la co-ocurrencia de un grupo de términos, determina la existencia de un frente de investigación, problema común o tema de actualidad en el dominio analizado (Olmeda-Gómez, Ovalle-Perandones y Perianes Rodríguez, 2017).
La comunidad científica vinculada a los estudios métricos de la información, a partir del surgimiento de estas técnicas, se ha focalizado en su aplicación para el estudio de muy diversos temas de investigación, la evaluación de sus características, y el desarrollo de soluciones híbridas, de cuya imbricación se pretende obtener mapas bibliométricos más objetivos y con menos limitaciones (Glänzel, 2012; Zhao y Strotmann, 2015). Sin embargo, pocos investigadores se han dedicado a caracterizar o evaluar la evolución de su utilización en entornos altamente especializados (Boyack y Klavans, 2010; Morris, 2005), y el alcance multidisciplinar de las investigaciones donde estas han sido aplicadas.
El presente trabajo tiene como objetivo analizar el comportamiento de la producción científica dedicada al estudio o aplicación de las técnicas de co-citación, acoplamiento bibliográfico y co-ocurrencia de términos, a partir de fuentes de información de máxima visibilidad internacional. Particularmente, se hace énfasis en el estudio de la distribución temática de estas investigaciones.
2. Metodología
Se utilizó como fuente de información primaria el Web of Science TM (WoS), desarrollado por Clarivate Analytics. La búsqueda incluyó todos los índices de citas comprendidos en la colección núcleo (Core Collection) de esta base de datos, disponible a través de la biblioteca digital de la Universidad Nacional Autónoma de México (UNAM). Los registros fueron recuperados el 1ro de agosto de 2020.
Se utilizaron las siguientes estrategias de búsqueda para la recuperación de los registros bibliográficos objeto de análisis:
Los registros recuperados correspondientes a cada técnica analizada fueron refinados, excluyendo de las muestras el año 2020. De igual forma, se selecionaron para el análisis los siguientes tipos de documentos: artículos de investigación, artículos de revisión, trabajos publicados en actas de congresos y capítulos de libros.
Se estudió el comportamiento anual de la investigación que ha utilizado las tres técnicas analíticas. Se caracterizó la investigación relacionada con cada técnica a partir de los siguientes elementos:
Promedio de autores por artículo.
Cantidad de publicaciones seriadas.
Cantidad de países, y países más productivos.
Instituciones más productivas.
Cantidad de categorías temáticas del WoS que cubren la producción relativa a cada técnica.
El análisis del alcance multidisciplinar de las investigaciones requirió el desarrollo de los siguientes indicadores, derivados del esquema de clasificación de revistas del WoS:
Índice de concentración temática de la producción científica (CTp): Medida que expresa el núcleo o número mínimo de categorías temáticas del WoS que recogen aproximadamente el 80 % (pCore) de un conjunto de artículos.
Índice de concentración temática de la citación (CTc): Medida que expresa el núcleo o número mínimo de categorías temáticas del WoS que recogen aproximadamente el 80 % (cCore) de los documentos que citan a un conjunto de artículos.
Se empleó el análisis documental como técnica que complementa el estudio métrico, al contribuir con la explicación e interpretación de los resultados, así como al establecimiento de los marcos referenciales. Se utilizó el programa Microsoft Excel para la representación visual de los resultados obtenidos.
3. Resultados y discusión
Las estrategias de búsqueda desplegadas, y posteriormente refinadas, permitieron analizar un total de 1.309 registros relacionados con técnicas de co-citación, 292 con técnicas de apareo bibliométrico y 1.244 con técnicas de co-ocurrencia de términos. La Figura 1 muestra la evolución por décadas de la literatura que ha utilizado estas tres técnicas desde su creación hasta el año 2019, observándose un comportamiento creciente y una explosión de artículos durante la última década.
El crecimiento durante los últimos diez años ha sido estable. A partir del 2012, con el desarrollo de nuevos métodos y herramientas para la minería de textos y la emergencia del análisis de grandes volúmenes de datos, el análisis de la co-ocurrencia de términos pasó a ocupar una posición de liderazgo. Durante este período, la emergencia de investigaciones que desarrollan redes dinámicas de co-palabras se hizo evidente (Katsurai y Ono, 2019; Wang, Cheng y Lu, 2014; Zhang et al., 2017). No obstante, en el año 2019 nuevamente la co-citación fue la técnica más utilizada por los investigadores.
Como puede observarse, la co-citación y la co-ocurrencia de términos ostentaron los mayores valores en cuanto a volumen de producción e impacto (Tabla 2). Si bien se alcanzó una importante cantidad de artículos en el caso de la co-citación, la co-ocurrencia de términos se divulgó en una mayor cantidad de revistas, y estas abarcaron a su vez un número cada vez creciente de categorías temáticas. De igual forma, la cantidad de países participantes se distinguió en la investigación que analizó o aplicó técnicas de co-ocurrencia de términos (Tabla 3).
Los estudios que aplicaron técnicas de co-citación exhibieron un mayor índice H, y un promedio de 25 citas por cada artículo publicado, superior al resto. El volumen de citas recibidas y artículos citantes duplicó, en el caso de la co-citación, lo alcanzado por la investigación relacionada con el análisis de términos. El índice de asociatividad se aproximó a los tres autores por artículo en cada caso. En las tres técnicas, las categorías temáticas a las que pertenecieron los artículos citantes superaron el 75% de la cobertura temática del WoS, por lo que el alcance temático de las investigaciones ha sido sumamente amplio. El acoplamiento bibliográfico fue la técnica menos utilizada. Sin embargo, su promedio de citas por artículo superó al de la co-ocurrencia de términos.
China, Estados Unidos y España se encuentran entre los cuatro países más productores de acuerdo con cualquiera de las técnicas utilizadas (Tabla 3).
La co-citación ha sido fundamentalmente aplicada por investigadores chinos y norteamericanos. Los trabajos más relevantes liderados por autores chinos han sido investigaciones aplicadas, que han utilizado técnicas de co-citación para el estudio de determinados campos temáticos, como la gestión de riesgos en cadenas de suministros (Tang y Musa, 2011), la investigación sobre redes sociales (Shiau, Dwivedi y Yang, 2017) o la literatura sobre asociaciones público-privadas (Song, Zhang y Dong, 2016), entre otros múltiples temas. La Facultad de Gestión de Información de la Universidad de Wuhan y el WISE Lab de la Universidad Tecnológica de Dalian lideran las investigaciones del gigante asiático (Tabla 4).
Los principales aportes de los Estados Unidos, además de los trabajos fundacionales, han estado vinculados al desarrollo de metodologías y herramientas para el mapeo de dominios del conocimiento (Boyack, Klavans y Borner, 2005; Chen, 2006; White y McKain, 1998). Relevantes figuras de los estudios métricos de la información se han especializado en esta técnica, como Henry Small (Clarivate), Howard White y Katherine McKain (Universidad de Drexel), todos galardonados con la medalla Dereck De Solla Price que otorga la Sociedad Internacional de Cienciometría e Informetría (ISSI); de conjunto con investigadores activos de reconocida trayectoria, como Richard Klavans y Kevin Boyack (SciTech Strategies Inc), Katy Borner (Universidad de Indiana), y especialmente Chaomei Chen, creador del programa CiteSpace, quien lidera las investigaciones en la Universidad de Drexel, la institución más productiva en materia de técnicas de co-citación (Tabla 4).
Las Universidades de Granada y Valencia ocupan posiciones cimeras en la investigación española, donde destacan autores como Enrique Herrera Viedma y Félix de Moya Anegón, este último líder del Grupo SciMago, con importantes aportes en materia de mapeo de dominios del conocimiento. José María Merigó Lindahl, profesor del Departamento de Sistemas de Información y Auditoría de la Universidad de Chile, fue el autor más productivo en la aplicación de esta técnica, y el principal exponente por Latinoamérica. Otros relevantes expertos son el holandés Loet Leydesdorff (Universidad de Leiden) y el sueco Olle Persson (Universidad de Umea), innovadores en el desarrollo de herramientas para el procesamiento y análisis de citas bibliográficas; así como el binomio canadiense Dangzhi Zhao / Andreas Strotmann (Universidad de Alberta), con sus aportes al aparato metodológico (Tabla 4).
Desde la dimensión metodológica, las técnicas de co-citación han evolucionado a lo largo del período de estudio, y se han ido incorporando nuevos enfoques analíticos, orientados fundamentalmente a la caracterización de dominios. La obtención de estructuras intelectuales derivadas de las relaciones existentes entre los elementos que componen las referencias bibliográficas, tuvo en el Análisis de co-citación de documentos (DCA, por sus siglas en inglés), su primer desarrollo (Small, 1973). Con posterioridad, se incorporó a su arsenal el Análisis de co-citación de autores (ACA, por sus siglas en inglés) (White y Griffith, 1981), con el cual Howard White y Katherine McKain mapearon la base intelectual de las ciencias de la información (White y McCain 1998). Y en la siguiente década, se propone el Análisis de Co-citación de Revistas (JCA) (McCain, 1991), con el cual diversos autores, entre ellos Loet Leydesdorff y la propia Katherine McKain, han intentado analizar fenómenos relacionados con la interdisciplinariedad y la transdisciplinariedad (Leydesdorff y Rafols, 2011; McCain y Whitney, 1994).
El siglo XXI se ha distinguido en este contexto, porque la co-citación de autores ha experimentado innovaciones derivadas de la observación de Persson (2001), quien estimó necesario contemplar en el análisis a todos los autores de los documentos citados, y no solo al primer autor, como hasta entonces fue la práctica por limitaciones de la base de datos. Sobre este enfoque, diferentes autores enriquecieron la técnica analítica, no solo contemplando el total de autores citados, sino también incorporando nuevas técnicas de análisis multivariado para representación de la estructura intelectual (Eom, 2008; Zhao y Strotmann, 2008a). Por su parte, investigadores del Grupo SciMago (España) se basaron en el esquema de clasificación de revistas del WoS, y propusieron una técnica para mapear dominios del conocimiento a partir de la co-citación de clases y categorías temáticas (Moya-Anegón et al., 2004).
En el presente estudio, el esquema de clasificación de revistas del WoS fue utilizado para analizar el alcance multidisciplinar de la investigación que involucró las técnicas de co-citación. En este sentido, las 787 publicaciones seriadas donde se difundieron estos estudios, abarcaron 142 categorías temáticas, que representan el 56 % del total de categorías identificadas en el esquema de clasificación (Tabla 2). Al mismo tiempo, los 20.375 artículos que citaron al menos una vez alguno de los 1.309 artículos analizados, fueron cubiertos por 235 categorías temáticas (92,2 %). Si embargo, los nuevos índices que se presentan en la investigación, a partir de un enfoque basado en el principio de Pareto, permitieron analizar la dimensión multidisciplinar por los núcleos temáticos que concentran el 80% de la producción y la citación (Figura 3).
Así, el mayor volumen de producción científica sobre técnicas de co-citación abarcó 16 categorías temáticas. Un tercio de ellos se diseminaron en revistas del dominio origen (ciencia de la información y bibliotecología), y el resto se distribuyó en cinco categorías temáticas relacionadas con las ciencias de la computación, tres categorías del área de la gestión, tres categorías de ciencias ambientales, dos categorías de ingeniería, y una percápita en las áreas de educación y economía. Por su parte, el núcleo temático que concentró los artículos citantes abarcó un número mayor de categorías temáticas (24). La proporción del dominio origen fue menor (19 %). Las 16 categorías presentes en la producción también se identificaron en el núcleo de citación, y se incorporaron ocho categorías temáticas: dos nuevas ingenierías, una ciencia social, y áreas tan disímiles como la biotecnología y microbiología aplicada, planificación urbana regional, telecomunicaciones, ocio hotelero-deporte-turismo, y la categoría que cubre las revistas de alcance multitemático. La baja proporción en ambos casos del dominio origen, la nutrida composición de los núcleos temáticos, y la diversidad temática observada en ellos, manifiestan el alcance multidisciplinar de los estudios métricos de la información, y particularmente, de la literatura sobre técnicas de co-citación; así como su naturaleza interdisciplinar.
A pesar de su utilidad, el acoplamiento bibliográfico ha sido la técnica menos utilizada entre las estudiadas en la presente investigación. Sin embargo, fue demostrada la mayor precisión de su enfoque para el mapeo bibliométrico (Boyack y Klavans, 2010), causa que puede estar influyendo en el crecimiento sostenido desde el año 2010. Tradicionalmente, la técnica se limitaba a agrupar conjuntos de documentos a partir de los artículos citados. Sin embargo, diversos autores han introducido innovaciones que permiten el uso para el acoplamiento de diversos elementos de la referencia, como el análisis del acoplamiento bibliográfico de autor (author bibliographic-coupling analysis, ABCA) (Zhao y Strotmann, 2008b), el acoplamiento autor descriptor (author keyword coupling analysis, AKCA) (Yang et al., 2016), o del título de las revistas (Boyack, Börner y Klavans, 2009). Durante los últimos años, se ha consolidado el uso de métodos híbridos, basados en acoplamientos bibliográficos y minería de textos (Glänzel, 2012; Meyer-Brötz et al., 2018; Thijs, Schiebel y Glänzel, 2013).
Estados Unidos lidera la investigación que emplea esta técnica para la determinación de frentes de investigación en un dominio (Tabla 3). El Instituto Tecnológico de Georgia, la compañía Clarivate y la Universidad de Indiana (Campus Bloomington) son las mayores instituciones productoras de Norteamérica. Autores como el emblemático Eugene Garfield, fundador del Instituto de Información Científica (ISI) de Filadelfia, Richard Klavans, Kevin Boyack (SciTech Strategies Inc), Steven A. Morris (Baker-Hughes Inc) y Alan L. Porter (Instituto Tecnológico de Georgia) destacan entre los principales ejecutores de la técnica. China es el segundo mayor productor, con la Universidad Tecnológica de Beijing y la Facultad de Gestión de Información de la Universidad de Wuhan entre las instituciones líderes; seguido de España, que tuvo en la Universidad de Barcelona su principal exponente (Tabla 4).
La Universidad de Chile, nuevamente a través del autor José María Merigó Lindahl, fue la institución más productiva. La Universidad Nacional de Taiwán y la Universidad Católica de Leuven (Bélgica) le siguieron en ese orden, lideradas ambas por los investigadores Mu-Hsuan Huang y Wolfgang Glänzel; este último, uno de los principales exponentes de los estudios métricos de la información en Europa. Investigadores especializados en técnicas híbridas, como el belga Bart Thijs (Universidad Católica de Leuven), el austriaco Edgar Schiebel (Instituto Tecnológico de Austria) y el sueco Bo Jarvening (Universidad de Gotemburgo), completaron el grupo de autores significativos (Tabla 4).
La producción científica que aplicó técnicas de acoplamiento bibliográfico se difundió en 155 publicaciones seriadas, que abarcaron solo 64 categorías temáticas (25 % del total), muy por debajo de las otras técnicas (Tabla 2). No obstante, los 4.173 artículos que citaron al menos una vez alguno de los 292 artículos estudiados, fueron cubiertos por 194 categorías temáticas (76 %), lo que indicó una influencia que rebasa con creces los marcos disciplinarios. Este comportamiento fue evidenciado cuando se analizó el núcleo que concentra el 80 % de la producción y la citación.
Solo cinco categorías abarcaron el 80 % de la producción científica relacionada con técnicas de acoplamiento bibliográfico. La mitad de ellos se publicaron en revistas del dominio origen (ciencia de la información y bibliotecología), y el resto se distribuyó en dos categorías temáticas relacionadas con las ciencias de la computación, y dos categorías del área de la gestión. Sin embargo, el núcleo temático que concentró los artículos citantes triplicó el número de categorías temáticas (17). La proporción del dominio origen fue de un 35 %; las 5 categorías presentes en la producción también se identificaron en el núcleo de citación, y en el mismo orden; y se incorporaron 12 categorías temáticas: cuatro relacionadas con las ciencias físicas y la ciencia de materiales, tres con la ciencia ambiental, dos con las ciencias de la computación, una ciencia social, una ingeniería, y la categoría dedicada a revistas multidisciplinarias. Si bien la investigación ha focalizado su diseminación en revistas de la especialidad, la composición temática del núcleo de citación refleja la influencia que ha tenido la aplicación de técnicas de acoplamiento bibliométrico sobre otros dominios del conocimiento. De hecho, contrasta esa proyección tan disciplinar, con el alcance multidisciplinar y la naturaleza interdisciplinar que se manifiesta en la actividad de citación.
La técnica de co-ocurrencia de términos, como se expuso anteriormente, ha tenido un especial desarrollo durante la última década analizada. Esto se ha debido, además de a los aportes que ha brindado la introducción de la inteligencia artificial y el aprendizaje automático a los procesos de minería de textos, a la inserción de la co-ocurrencia de palabras en metodologías híbridas para el mapeo de dominios del conocimiento (Glänzel, 2012). De los trabajos iniciales que concibieron la utilización de los descriptores y las palabras más frecuentes en el texto de los artículos para la construcción de los mapas (Callon et al., 1983; Rip & Courtial, 1984), a la utilización de los descriptores y palabras en el título o en los resúmenes de los artículos citantes (en lo que sería más bien una variante de co-citación), y el desarrollo de técnicas de Análisis de Semántica Latente (Leydesdorff y Welbers, 2011), el uso de los términos como criterio para la representación del conocimiento se ha consolidado.
China es el país que ha estado a la vanguardia en estas investigaciones, duplicando los estudios realizados por autores de los Estados Unidos. La participación de investigadores de su Academia de Ciencias en las investigaciones, y el liderazgo de instituciones como la Facultad de Recursos y Ciencia Ambiental de la Universidad de Wuhan, la Universidad de Pekin, y la Universidad Tecnológica de Dalian son notables. Song Hong (Universidad de Wuhan) es el más productivo de los autores chinos, con estudios bibliométricos y revisiones sistemáticas especialmente relacionados con la temática ambiental (Liu, Zhang y Hong, 2011), urbanización (Wang et al., 2012) y sistemas de información geográfica (Tian, Wen y Song, 2008; Zhuang et al., 2013) (Tabla 4).
La producción estadounidense ha estado muy diversificada, tanto a nivel institucional, autoral y temático, con amplia colaboración con instituciones chinas, y algún que otro acercamiento a la caracterización de la estructura cognitiva de la Ciencia de la Información (Milojević et al., 2011). Inglaterra fue el tercer mayor productor de artículos, con protagonismo de la Universidad de Londres, y de autores como John A. Bullinaria (Universidad de Birmingham) y Joseph P. Levy (Universidad de Roehampton), quienes han estudiado las posibilidades computacionales para formular y validar representaciones de significados de palabras a partir de estadísticas de co-ocurrencia de términos (Bullinaria y Levy, 2007, 2012); o como Clive Seale (Universidad de Londres) y Jonathan Charteris-Black (Universidad de West England) que aplicaron técnicas de análisis de descriptores en entornos web de temática biomédica (Seale et al., 2010; Seale, Ziebland y Charteris-Black, 2006).
España se mantuvo entre los principales productores, con una importante contribución del Departamento de Ciencias de la Computación e Inteligencia Artificial de la Universidad de Granada, que ha derivado en el Instituto Andaluz Interuniversitario sobre Ciencia de Datos e Inteligencia Computacional. Bajo el liderazgo de autores como Enrique Herrera-Viedma (Universidad de Granada) y Manuel Jesús Cobo (Universidad de Cádiz), los investigadores españoles han desarrollado métodos basados en co-ocurrencia de términos para detectar, cuantificar y visualizar la evolución de campos de investigación (Cobo et al., 2011; Cobo et al., 2015). Otros relevantes autores familiarizados con esta técnica, incluyen a los taiwaneses Hsin-Ning Su y Pei-Chun Lee, del Centro de Información e Investigación sobre Políticas de Ciencia y Tecnología. Por supuesto, este grupo de alta productividad también está integrado por los sociólogos franceses Jean Pierre Courtial y Michel Callon, que desde el Centro de Sociología de la Innovación de París crearon e impulsaron la técnica, hasta convertirla en una de las principales herramientas en el campo de los Estudios Métricos de la Información, con una notable utilización en otras disciplinas científicas.
De hecho, en el caso de la literatura que aplicó técnicas de co-ocurrencia de términos, se observó en el presente estudio la mayor actividad multidisciplinar entre las tres técnicas analizadas. Las 948 publicaciones seriadas que se utilizaron como vehículos de difusión, abarcaron 159 categorías temáticas, que representan el 62,4 % del total de categorías del esquema WoS (Tabla 2). De igual forma, los 10.804 artículos que citaron a los 1.244 artículos analizados, fueron cubiertos por 234 categorías temáticas (91,8 %). Por su parte, el análisis de los núcleos que concentran el 80 % de la producción y la citación, arrojó resultados que acentuaron ese carácter multidisciplinar de la investigación.
Un total de 19 categorías abarcaron el 80 % de la producción científica relacionada con técnicas de co-ocurrencia de términos. Solo un 22,7 % se situó en revistas del dominio origen (ciencia de la información y bibliotecología), y el resto se distribuyó en cinco categorías temáticas relacionadas con las ciencias de la computación, cuatro categorías de ciencias sociales (incluidas dos categorías de lingüística y comunicación), tres categorías de ciencia ambiental, dos categorías de gestión, además de las categorías telecomunicaciones y educación, lo que significó una mayor diversidad en el núcleo de producción con respecto a las otras dos técnicas analizadas.
En cuanto al núcleo temático que concentró los artículos citantes, este estuvo compuesto por 30 categorías temáticas, la mayor cifra alcanzada por cualquiera de las técnicas analizadas, a pesar de que los artículos citantes fueron mucho menos que en el caso de las técnicas de co-citación (Figura 5).
La distribución en este núcleo fue más homogénea, con una proporción del dominio origen de solo un 17 %. Una vez más, las categorías incluidas en el núcleo de producción estuvieron también representadas en el núcleo de citación, aunque se observó mayor movimiento en las posiciones y proporciones de estas categorías, la cual fue más evidente en las categorías ambientales. Además, se incorporaron otras once categorías a este núcleo: tres categorías de Ingeniería, tres categorías relacionadas con las ciencias médicas (no presentes en las otras dos técnicas), una categoría de gestión, y áreas como la planificación urbana regional, economía, energía y combustibles, y ocio hotelero-deporte-turismo. Por tanto, en el caso de la co-ocurrencia de términos, se acentuó el alcance multidisciplinar y la naturaleza interdisciplinar de las investigaciones.
Conclusiones
El análisis de los aportes de las técnicas de co-citación, acoplamiento bibliográfico y co-ocurrencia de términos en el presente trabajo evidenció la creciente evolución de la literatura que utiliza estas técnicas para la representación y análisis de dominios del conocimiento; técnicas cuya selección ha respondido a determinados espacios temporales, y a contextos concretos de desarrollo y demostración de robustez de las mismas. Esto no excluye la probabilidad de que esta selección pueda responder no solo a la asunción de presupuestos teóricos-metodológicos específicos, en correspondencia con el objetivo de las investigaciones, como expresión de posiciones epistemológicas; sino también a la facilidad de uso de algunas de ellas, o su frecuente uso, en detrimento de la aplicación de las más pertinentes en los estudios en cuestión.
La utilización de la colección núcleo del WoS, permitió acceder a la literatura con mayor visibilidad internacional, adscrita a la llamada “corriente principal” de la Ciencia, e identificar a los autores, instituciones y países que han liderado las investigaciones, tanto la que ha aportado elementos a su desarrollo metodológico, como la que ha aplicado las metodologías al estudio de los diversos campos del conocimiento. La existencia de un núcleo altamente productivo en cada técnica evidencia la sostenida aplicación intensiva y extensiva de las mismas, ante el reconocimiento comunitario a nivel mundial de su importancia y validez.
Los indicadores utilizados, permitieron identificar el carácter multidisciplinar y la naturaleza interdisciplinar de la producción científica relacionada con estas técnicas analíticas. La amplia distribución temática de estas investigaciones se puso de manifiesto a través de los índices de concentración de la producción y la citación, los cuales mostraron volumenes de producción multidisciplinarios (fundamentalmente en las técnicas de co-citación y co-ocurrencia de términos), y especialmente diversos en sus redes de influencia. Los dominios tecnológicos fueron los más analizados, aunque en los núcleos temáticos de citación también hubo presencia de entornos biomédicos, económicos y sociales. De esta manera, se visibiliza la influencia de las metrías y sus técnicas, las cuales trascienden los límites del dominio de conocimiento que las originó desde propuestas teóricas y meta-teóricas.
Estas técnicas, a su vez, contribuyen al examen crítico a partir de la identificación de las transformaciones que determinan el dinamismo y evolución de la estructura intelectual y social de la multiplicidad de campos de conocimientos y sus interdependencias, en relación recíproca con los factores contextuales espaciales y temporales.