La toma de medidas en el ámbito de la morfometría conlleva sesgos en el nivel de precisión y, por ende, error; ya sea empleando métodos morfométricos tradicionales, morfogeométricos o la aplicación de estos últimos en la antropología virtual. Cuando los niveles de imprecisión son altos se genera ruido, pudiendo dar lugar a resultados engañosos e interpretaciones equivocadas (Fourie et al., 2011; Fruciano, 2016; Muñoz-Muñoz y Perpiñán, 2010; Pérez et al., 2004). Tradicionalmente se han considerado una serie de factores que afectan la toma de medidas (Arnqvist y Martensson, 1998; Dudzik y Kolatorowicz, 2016; Fox et al., 2020; Fruciano, 2016; González et al., 2004 Muñoz-Muñoz y Perpiñán, 2010; Robinson y Terhune, 2017) tales como: 1) el instrumental de medición presenta menor error cuanto más sofisticado y preciso es. 2) La definición de la medida, en ocasiones la descripción de los puntos homólogos o landmarks y vértices de las medidas es vaga, imprecisa o compleja. 3) La calidad y preservación del material a examinar, así como algunas de sus características específicas, como por ejemplo la flexibilidad de las estructuras (algunas dimensiones craneanas pueden variar por la humedad, el desgaste, la erosión, etc.). 4) El error disminuye a medida que aumenta el tamaño del rasgo, aunque existe cierta discusión en este punto. 5) La experiencia del investigador que realiza la medición, siendo menores las inconsistencias en los sujetos entrenados. 6) El contexto en el que se encuentra el medidor (temperatura, luz, lugar, etc.). En el ámbito de la morfometría clásica, dos tipos de estudios se realizaban a fin de medir el error, el intraobservador en que un observador analizaba el error propio y el interobservador en el cual diferentes investigadores utilizando un mismo método examinaban las divergencias entre sus observaciones. Ambos errores son considerados personales y pueden verse afectados por los factores señalados.
Con el desarrollo de la morfometría geométrica (MG) a los factores anteriormente señalados habría que añadir otros que se producen durante la adquisición y procesamiento del material a analizar: 1) en ocasiones los landmarks presentan definiciones imprecisas para los estudios de MG, dando lugar a interpretaciones diversas al registrar los puntos homólogos. Este tipo de error es análogo a aquel relacionado con la definición de la medida (Chiari et al., 2008; Fruciano, 2016; Muñoz-Muñoz et al., 2016; Robinson y Terhune, 2017; Toneva et al., 2020; von Cramon-Taubadel, et al., 2007). 2) Los tipos de puntos homólogos (I, II o III, definidos sensuBookstein, 1991) en modelos digitales pueden ser difíciles de identificar debido a la alteración de la superficie. Los puntos de referencia tipo I y II, por lo general, son más fáciles de identificar y presentan menor error (Fruciano, 2016; Katz y Friess, 2014; Muñoz-Muñoz y Perpiñán, 2010; Muñoz-Muñoz et al., 2016; Robinson y Terhune, 2017; Ross y Willians, 2008; Shearer et al., 2017; Sholts et al., 2011; Toneva et al., 2020; von Cramon-Taubadel et al., 2007). Sin embargo, en algunos casos puntuales, como en digitalizaciones mediante escáner, pueden ser más precisos los puntos homólogos de tipo III (Sholts et al., 2011; Toneva et al., 2020). Atender este tipo de detalles en el diseño de configuraciones de landmarks que registran la forma de las estructuras biológicas es importante. En el caso de la MG tridimensional conviene considerar, además: 1) la texturización, proceso mediante el cual la superficie de la digitalización adquiere una representación sombreada y coloreada a partir de imágenes, por ejemplo, las fotografías. Este procedimiento incrementa la semejanza del modelo al objeto real, permitiendo la observación de características específicas de alto valor en el análisis y facilitando la identificación y registro de puntos homólogos, especialmente los de tipo I, que en el caso del cráneo conllevan la visibilidad de la sutura, que puede estar obliterada (Jurda y Urbanová, 2016; Katz y Friess, 2014; Toneva et al., 2020). La influencia de esta característica en el error continua en discusión, dado que algunos autores apuntan que esta característicatenova no influye en la precisión (Katz y Friess, 2014); mientras otros, aseveran lo contrario (Toneva et al., 2020). 2) Las alteraciones derivadas de los diferentes procesos de digitalización, que pueden realizarse a través de varias técnicas tales como: Tomografía Computarizada (TC), Resonancia Magnética (RM), escáner, brazos digitalizadores como MicroScribe, fotogrametría, etc. Se ha de tener en cuenta que la resolución del instrumento de digitalización es la característica principal que determina la calidad del modelo tridimensional (Tenova et al.,2020). Pero no solo las diferencias que pueden observarse entre estas, sino que cada técnica presenta diferentes softwares, los cuales difieren en la forma en la cual se calcula la resolución del modelo 3D, pudiendo llegar a afectar la precisión de la medición (Balolia y Massey, 2021; Waltenberger et al., 2021; White et al., 2020).
El desarrollo de la MG 3D junto con la antropología virtual (AV), hacen uso de herramientas provenientes de otros campos del conocimiento más allá de la antropología, proporcionando un enfoque multidisciplinar para el estudio de la morfología de los seres humanos (Weber, 2015; Weber et al., 1998). La AV trabaja con objetos virtuales derivados de digitalizaciones realizadas mediante técnicas diversas y, que en las últimas décadas ha dado lugar a la digitalización de amplias series esqueléticas. Escenario que ha permitido generar colecciones digitales que, en ocasiones se han puesto a disposición de morfómetras y antropólogos a través de bases de datos. La creación de estas plataformas tiene una serie de ventajas, deja de ser necesario desplazarse para la toma de la muestra, con el consiguiente ahorro de tiempo y fondos; así como, se contribuye a la preservación al evitar la manipulación del material esquelético con la consiguiente degradación (Balolia y Massey, 2021; Buzi et al., 2018; Evin et al., 2016; Friess, 2012; Kullmer, 2008; Profico et al., 2018; Sforza, et al., 2013; Veneziano, et al., 2018; Waltenberger et al., 2021; Weber, 2015). A la vez, es posible aumentar el tamaño muestral, dado que hay grandes colecciones digitales y, por ende, el poder estadístico del estudio a desarrollar; situación
limitada históricamente debido a la escasez de muestra disponible en el estudio de colecciones esqueléticas (Fruciano et al., 2017; Kulmer, 2008; Kuzminsky y Gardiner, 2013; Robinson y Terhune, 2017). Sin embargo, los mecanismos de digitalización son numerosos y estas plataformas albergan archivos procedentes de fuentes diversas. El uso combinado de digitalizaciones tomadas por técnicas diferentes introduce un nuevo tipo de error, el error intermétodo (Robinson y Terhune, 2017). Este error se considera instrumental, por contra a los anteriores que se denominan personales, dado que las variaciones derivan de las diferencias entre los procesos de digitalización o de combinaciones de datos procedentes de diferentes protocolos de imágenes (Arnqvist y Martensson, 1998; Fox et al., 2020).
Hasta hace pocos años, los trabajos que prestaban atención al error en MG 3D eran escasos, fundamentalmente en el error intermétodo (Fourie et al., 2011; Fruciano, 2016; Robinson y Terhune, 2017; Ross y Willians, 2008). Sin embargo, esta tendencia se ha visto modificada durante el último lustro (Balolia y Massey, 2021; Buzi et al., 2018; Fox et al., 2020; Fruciano, 2016; Fruciano et al., 2017; Robinson y Ter-hune, 2017; Shearer et al., 2017; Toneva et al. 2020; Waltenberg et al., 2021). Los análisis apuntan a bajos niveles de error cuando se emplean mecanismos diversos, pudiendo compatibilizarse el uso de archivos procedentes de diversas fuentes. Así lo han demostrado estudios que comparan las diferencias entre escáner y TC (Balolia y Massey, 2021; Brzobohatá et al., 2012; Shearer et al., 2017); escáner y fotogrametría (Evin et al., 2016; Fourie et al., 2011; Fruciano et al., 2017; Hassett y Lewis-Bale, 2016; Katz y Friess, 2014; Mathys et al., 2014; Ortiz Sanz, et al., 2010); escáner, TC y MicroScribe (Robinson y Terhune, 2017); escáner, TC y fotogrametría (Buzi et al., 2018; Fourie et al., 2011; Mathys et al., 2014) o escáner, TC, fotogrametría y MicroScribe (Waltenberger et al., 2021). En los últimos años, se ha realizado estudios que analizan distintos dispositivos de un mismo tipo de digitalización, i.e., diferentes programas de fotogrametría (Waltenberger et al., 2021) y/o diversos escáneres de superficie (Balolia y Massey, 2021), así como un mismo escáner con diferentes resoluciones (Toneva et al., 2020).
El presente trabajo analiza el error intermétodo e intraobservador a partir de ocho cráneos humanos procedentes de Patagonia Austral, escaneados mediante tomografía computarizada (TC), escáner de superficie y fotogrametría. En primer lugar, se examina el error intermétodo bajo la hipótesis de que el posible error existente entre métodos no será significativo, permitiendo de este modo la utilización conjunta de archivos de fuentes de digitalización diferentes. En segundo lugar, se estudiará el error intraobservador en cada una de las metodologías a fin de saber cuál de ellas es la que presenta un menor error. Se hipotetiza que tanto la textura como el registro de los puntos de referencia sobre la superficie ósea no influirán el grado de expresión de este tipo de error. Pese a que se ha estudiado con anterioridad el efecto que cada uno de estos factores ejerce de manera individual sobre la calidad de las digitalizaciones y mediciones, son escasos los trabajos que han analizado previamente el impacto de ambos parámetros sobre el error acumulado por un mismo observador.
MATERIALES Y MÉTODOS
El material utilizado para llevar a cabo este estudio fueron ocho cráneos humanos de Patagonia Austral (Tabla 1) que se encontraban en el reservorio del Laboratorio de Ecología Evolutiva Humana (LEEH). Se eligieron aquellos individuos adultos que presentaron un nivel de completitud craneal muy bueno (sensuBuikstra y Ubelaker, 1994), dado que no todos los sujetos presentan estados de completitud que permitan la realización de estudios morfogeométricos, redundando en la conformación de las muestras. Seis individuos provenientes del cementerio de la Misión Salesiana de “Nuestra Señora de La Candelaria” (MSLC), cercana a la ciudad de Río Grande (Tierra del Fuego, Argentina); el séptimo sujeto fue exhumado en el yacimiento de Las Mandíbulas que se encuentra en la Bahía San Sebastián, y; el octavo proviene de la ciudad de Puerto San Julián (Santa Cruz, Argentina). Los ocho individuos son adultos, cinco masculinos, dos femeninos y uno indeterminado. La información bioantropológica acerca de estos individuos se ha extraído de la Base de Información Bioantropológica de Patagonia Austral -BIBPA- (D’Angelo del Campo et al., 2020). Los ocho sujetos analizados en el momento en el cual se llevó a cabo la digitalización se encontraban en el reservorio del LEEH adscrito al CONICET y sito en la Universidad Nacional del Centro de la Provincia de Buenos Aires (UNCPB). Los individuos pertenecientes a la SMLC han sido restituidos a la Provincia de Tierra del Fuego, Antártida e Islas del Atlántico Sur, para su posterior restitución a la comunidad originaria Rafaela Ishton.
n | Código BIBPA | Individuo | Institución | Procedencia Yacimiento | Ubic. geof. | Edad | Sexo | Datación |
1 | 270 | Las Mandíbulas | LEEH | Las Mandíbulas 1 | NIG | 20-34 | M | 1770 ± 180 dC |
2 | 289 | E 12-13 | LEEH | Cementerio MSLC | NIG | 35-45 | M | Post-contacto |
3 | 295 | C 15 | LEEH | Cementerio MSLC | NIG | 25-39 | M | Post-contacto |
4 | 298 | D 14 | LEEH | Cementerio MSLC | NIG | 18-20 | M | Post-contacto |
5 | 299 | C 14 (2) | LEEH | Cementerio MSLC | NIG | 19-20 | F | Post-contacto |
6 | 318 | DC 9-10 (1) | LEEH | Cementerio MSLC | NIG | 25-40 | M | Post-contacto |
7 | 320 | E 10-11 (2) | LEEH | Cementerio MSLC | NIG | 18-25 | F | Post-contacto |
8 | 303 | San Julián | LEEH | San Julián | IC | A | - | - |
LEEH: Laboratorio de Ecologia Evolutiva Humana; MSLC: Misión Salesiana "Nuestra Señora de La Candelaria"; NIG: Norte de Isla Grande; IC: Interior del Continente; M: Masculino; F: Femenino
Para la digitalización de los restos esqueléticos se utilizaron tres fuentes diferentes: 1) TC: técnica de imagen médica empleada para la obtención de imágenes de alta resolución del interior del cuerpo humano, específicamente para el estudio de tejidos duros, por ende, ideal para analizar el aparato esquelético. La TC se basa en la irradiación de un haz de rayos X que atraviesa una única sección de un objeto, en un giro de 360º alrededor de este. El objeto se va desplazando mientras es escaneado, obteniéndose una serie de imágenes consecutivas, radiografías 2D (slices). A partir de algoritmos que efectúan combinaciones de esas radiografías 2D se construyen modelos 3D. (Burghardt et al., 2011; Spoor et al., 2000; Waltenberger et al., 2021; Weber, 2015). 2) Escáner de superficie: técnica basada en la utilización de una fuente de luz visible o láser que se emite hacia el elemento a estudiar y cuya reflexión es recogida por un detector que lleva a cabo la reconstrucción digital. Este mecanismo se caracteriza por no ser invasivo, ni destructivo, ligero, fácilmente desplazable y permite obtener modelos 3D de gran calidad (Friess, 2012; Kuzminsky y Gardiner, 2013; Waltenberger et al., 2021). 3) Fotogrametría: metodología de superficie que cursa con la superposición digital de imágenes de la cara exterior del objeto. Las fotografías han de cubrir la superficie entera, solapándose entre estas a tal fin. Sobre cada una de las fotografías se identifican los puntos de interés (puntos que se marcan con un lápiz sobre la superficie de cada una de las imágenes y que permite solaparlas), que estarán repetidos, dando lugar a una nube de puntos a partir de la cual se crea una malla tridimensional de polígonos, mediante la unión de los puntos, generando una superficie (Chiari et al., 2008; Evin et al., 2016; Jurda y Urbanová, 2016; Waltenberger et al., 2021). La fotogrametría ha avanzado de manera notable en los últimos años debido a mejores cámaras y algoritmos más avanzados que han permitido incrementar la precisión, pasando de los milímetros a los micrómetros (Waltenberger et al., 2021). Dado que no se contó con la texturización en las digitalizaciones realizadas con escáner, dos factores diferencian a la fotogrametría de las otras dos metodologías: a) la texturización de la superficie; b) la marcación de los puntos homólogos sobre la superficie ósea, los cuales se pueden además observar posteriormente en aquellas digitalizaciones que presentan texturización, como es el caso de la fotogrametría.
El tomógrafo utilizado se encuentra en el Instituto Radiológico de Mar del Plata y es un Brilliance con 64 detectores de Philips con un espesor de 0,9 mm, encontrándose por debajo de los 1,25 mm de espesor, que pueden conllevar la pérdida de fidelidad anatómica (Ford y Decker, 2016). El escáner utilizado fue un Next Engine laser con una resolución de 67.000 puntos/pulgada (1 pulgada son 25,4mm) y una precisión de 0,127mm. El láser utilizado pertenece al Laboratorio de Morfología Virtual -LVM- (MNCN-CSIC). Por último, para el proceso fotogramétrico se utilizó el programa PhotoModeler 6.0®, para ello se desarrolló un protocolo conformado por 13 imágenes realizadas desde distintas posiciones con una cámara compacta Canon PowerShot SX520, 16 Megapixeles, Zoom 42x ultra gran angular, sobre un trípode Manfrotto, con el cráneo en el interior de una caja de luz, con unos parámetros fotográficos y de luz constantes y a una distancia fija. Un asunto para destacar fue la marcación con lápiz de los landmarks sobre la superficie ósea, a fin de facilitar la reconstrucción fotogramétrica; tras la toma de fotografías se limpió la superficie mediante una gasa empapada en alcohol de 96º, a fin de no dejar marcas y respetar lo máximo posible la preservación de los restos esqueléticos.
El conjunto de puntos utilizado para este estudio está compuesto por un conjunto de 35 puntos homólogos típicamente empleados para describir la forma del cráneo humano (Tabla 2, Fig. 1). El registro de puntos homólogos en coordenadas x, y, z se realizó en tres series separadas temporalmente por una semana. Se realizaron tres series, registrándose en cada una de ellas estos puntos para los ocho individuos por triplicado (TC, escáner y fotogrametría). En cada serie se colocaron los puntos siguiendo un mismo orden y mecanismo, i.e., el primer día, ocho de una técnica; el segundo, ocho de otra metodología; y el tercero, los ocho del mecanismo restante. Se registraron los puntos de referencia en los ocho cráneos en tres series (24 registros para cada tipo de digitalización), sumando un total de 72 digitalizaciones con los puntos registrados (24 cráneos por método). Las medidas fueron realizadas por una única persona, MDDdC.
Puntos homólogos | Abreviatura | Tipo | |
1 | Prostion | pr | I |
2 | Nasoespinal | ns | I |
3 | Nasión | n | I |
4 | Glabela | g | III |
5 | Bregma | b | I |
6 | Lambda | l | I |
7 | Inion | i | III |
8 | Opistion | o | III |
9 | Basion | ba | III |
10 | Estafilon | s | I |
11 | Orale | or | II |
12 y 24 | Maxilomalar | zm | I |
13 y 25 | Alare | al | III |
14 y 26 | Zigoorbital | zyo | I |
15 y 27 | Maxilonafrontal | mnf | I |
16 y 28 | Frontomalar orbital | fmo | II |
17 y 29 | Frontomalar temporal | fmt | I |
18 y 30 | Ectomolare | ecm | II |
19 y 31 | Endomolare | enm | II |
20 y 32 | Pterión | pt | I |
21 y 33 | Auricular | au | III |
22 y 34 | Temporomalar superior | zts | I |
23 y 35 | Asterión | as | I |
El proceso de registro de puntos de referencia en coordenadas x, y, z, sobre la superficie de los cráneos en las digitalizaciones realizadas mediante TC y escáner de superficie se efectuó mediante el software ViewBox 4 (www.dhal.com). En el caso de la fotogrametría, se seleccionaron las coordenadas x, y, z, para los 35 puntos homólogos específicos del estudio y se descartan el resto de los puntos utilizados en el proceso de tridimensionalización fotogramétrico. Las configuraciones de puntos de referencia fueron normalizadas para su posterior estudio empleando el Análisis Generalizado de Procrustres (Rohlf y Slice, 1990), ejecutado en MorphoJ® (Klingenberg, 2011).
Desde el punto de vista estadístico, no existe un consenso acerca de una metodología específica para el análisis del error (Fruciano, 2016; von Cramon-Taubadel et al., 2007), sino que depende del diseño experimental empleado en cada caso, las posibles fuentes de error que han de evaluarse y corregirse (Fruciano, 2016). En esta oportunidad, se realizaron las mismas pruebas para el estudio del error intermétodo e intraobservador. En el caso del error intermétodo se utilizó la tercera serie, la última realizada y la que suele presentar un menor error (Dudzik y Kolatorowicz, 2016; González et al., 2004; Sherer et al., 2017). Para el error intraobservador de cada uno de los mecanismos, se tomaron las coordenadas de cada uno de los ocho individuos en las tres tandas.
En cuanto a los análisis desarrollados, se realizaron tres análisis estadísticos a fin de contar con una mayor evidencia y una mejor visualización del estudio. 1) Procrustes ANOVA, modelo que asume la existencia de un conjunto de variación alrededor de cada punto homólogo de manera isotrópica (sin dirección preferencial), e independiente entre estos. Al ignorase la dirección permite cuantificar cantidades relativas de variación a distintos niveles (Klingenberg et al., 2002). Este análisis es particularmente útil para evaluar la importancia relativa del error de digitalización (Klingenberg et al., 2002). En este caso, el estadístico evalúa la hipótesis de independencia entre los tres métodos (error intermétodo) y las tres series de una misma digitalización (error intraobservador) 2) Análisis de Componentes Principales (ACP), permite examinar como se distribuyen los especímenes en el morfoespacio. En caso de un error reducido, las digitalizaciones del mismo individuo, independientemente del método utilizado para su digitalización (error intermétodo) o de la serie de punteado (error intraobservador), se agruparán en el morfoespacio de manera conjunta (Robinson y Terhune, 2017; von Cramon-Taubadel et al., 2007). Los dos primeros componentes principales, que acumulan la mayor variabilidad de varianza, se representan en un diagrama de dispersión utilizando elipses de confianza (al 90%) para agrupar a los individuos en función de su código específico de identificación. La ilustración de las diferencias morfométricas se realizó mediante gráficos denominados lollipop y wireframe, este último conecta los puntos homólogos entre sí. 3) Las distancias Procrustes se utilizaron para generar un tipo de cluster (Unweighted Pair Group Method with Arithmetic Mean -UPGMA-). Este método es uno de los más clásicos y simples para la reconstrucción de fenogramas. El árbol se genera gradualmente y por pares, agrupando los dos especímenes más cercanos entre sí en el primer nodo, y generando grupos dos a dos según avanza la jerarquía (Lemey et al., 2009). El uso del UPGMA permite explorar sí todas las observaciones de un individuo se agruparon conjuntamente (Robinson y Terhune, 2017). Para la realización de análisis estadísticos se utilizó MorphoJ® (Klingenberg, 2011) y para el tratamiento de las imágenes se utilizó Gimp 2.10® (Gimp development team 1996).
RESULTADOS
1. Error intermétodo
El Procrustes ANOVA del error intermétodo (Tabla 3) no reveló diferencias significativas entre los resultados de los distintos métodos de digitalización (F=0,45; p=0,854). Al no existir diferencias, la potencial combinación de las digitalizaciones de diferentes fuentes es viable.
SC | MC | gl | F | p-valor | |
Intermétodo | |||||
0,00255 | 0,000013 | 196 | 0,45 | 1 | |
Intraobservador | |||||
TC | 0,00139 | 0,00000711 | 196 | 0,27 | 1 |
Escáner | 0,00164 | 0,00000841 | 196 | 0,31 | 1 |
Fotogrametría | 0,000288 | 0,00000147 | 196 | 0,05 | 1 |
Suma de cuadrados Procrustes (SC). Media cuadrática Procrustes (MC). Grados de libertad (gl). Estadístico F de Goodall
*Nivel de significación: p < 0,05; ** Nivel de significatición: p < 0,001
El ACP mostró 23 componentes principales, explicando los dos primeros de manera conjunta un 42,8% de la varianza total (Tabla suplementaria 1). Las diferentes digitalizaciones de un individuo se agrupan en el morfoespacio (Fig. 2A). Sin embargo, cuando se observa el diagrama lollipop/wireframe del componente principal 1 se aprecia una variación notable con respecto a la forma consenso a nivel del bregma (punto de referencia -pr- 5) y discreto en asterion (pr 23 y pr 35), pterión (pr 20 y pr 32), opistión (pr 8), basión (pr 9), lambda (pr 6), entre otros (Fig. 3A). Los dos individuos que mayor grado de dispersión presentan son C 15 y DC 9-10 (1), precisamente aquellos que muestran una obliteración completa del Bregma, dificultando por tanto la localización de este punto homólogo en el proceso de registro de landmarks en coordenadas (Fig. suplementaria 1).
El cluster UPGMA (Fig. 4A) muestra como a excepción de la observación “Las Mandíbulas 1” (digitalización fotogramétrica), que no aparece agrupada con las digitalizaciones de TC y escáner de superficie, el resto de los individuos muestran las tres observaciones procedentes de distintas metodologías agrupadas. En cuanto, a la digitalización fotogramétrica de “Las Mandíbulas 1”, la dispersión se encuentra al nivel de ambos asterión, donde en este caso se encuentran huesos wormianos, los cuales no se llegan a observar con nitidez en las digitalizaciones sin textura (Fig. suplementaria 2). En todos los casos del análisis intermétodo se agrupan en el primer nodo las digitalizaciones realizadas mediante TC y escáner de superficie, quedando en todos los casos en el segundo nodo la digitalización fotogramétrica (Fig. 4A).
2. Error intraobservador
El Procrustes ANOVA del error intraobservador no mostró diferencias significativas entre las observaciones en ninguno de los métodos de digitalización (Tabla 3). De los estadísticos obtenidos de la TC (F=0,27; p=1), el escáner (F=0,31 y p=1) y la fotogrametría (F=0,05 y p=1), este último es el que presenta una F más cerca a cero y, por ende, presenta una menor fuerza estadística, siendo la variabilidad de la varianza menor entre los individuos. Al no existir tales diferencias, se asume que el error producido en el post-procesamiento y el proceso previo a los análisis no influirá en el estudio y, que el uso de cualquiera de las tres series realizadas para el error intermétodo no debería influir en el resultado final.
El ACP de la TC está compuesto por 23 componentes principales, los dos primeros explican conjuntamente el 43,4% de la varianza total (Tabla suplementaria 2). Al igual que en el análisis intermétodo, las digitalizaciones de un sujeto se agrupan en el morfoespacio, aunque cambia la conformación (Fig. 2B). De igual manera, se mantiene la variación del punto homólogo 5 (Fig. 3B), siendo igualmente C 15 y DC 9-10 (1) los que presentan mayor grado de dispersión.
El ACP del error intraobservador del escáner está conformado por 23 componentes principales, explicando el 47,7% entre los dos primeros CCPP (Tabla suplementaria 3). Las digitalizaciones de las tres series de cada individuo se observan de manera conjunta en el morfoespacio, aunque la distribución difiere de los dos diagramas de dispersión anteriores (Fig. 2C). Si bien, se continúa apreciando la misma modificación respecto a la forma media con la dispersión del punto de referencia 5 (Fig. 3C). Los individuos C 15 y DC 9-10 (1) presentan mayor grado de dispersión.
El ACP del estudio de error en el caso de fotogrametría está conformado por 22 componentes principales, uno menos que en los casos anteriores. Los componentes principales 1 y 2 abarcan el 41,7% de la varianza total (Tabla suplementaria 4). Cada individuo se agrupa con las digitalizaciones de sí mismo de otras series, con una conformación diferente a los casos anteriores (Fig. 2D). En este caso, la variación con respecto a la forma consenso en el componente principal 1 del punto homólogo 5 se reduce de manera notable (Fig. 3D). Los sujetos C 15 y DC 9-10 (1) no se diferencian por el grado de dispersión entre las diferentes observaciones.
Los cluster realizados en cada una de las técnicas de digitalización mostraron la agrupación de las tres observaciones de cada sujeto (Fig. 4). En los tres casos, la distancia entre observaciones es menor que la apreciada en el error intermétodo, siendo el análisis intraobservador fotogramétrico el que muestra las menores distancias y, por tanto, mayor precisión, reforzando el resultado observado tanto en el Procrustes ANOVA como en el ACP.
DISCUSIÓN
El error es inherente a cualquier estudio morfométrico, pudiéndose encontrar en cualquiera de las fases del análisis (Arnqvist y Martensson, 1998; Fruciano, 2016; Fruciano et al., 2017; Muñoz-Muñoz et al., 2016). Sin embargo, no se ha tenido en cuenta en los primeros trabajos de MG realizados durante las décadas de los 80 y 90, ni tampoco es frecuente su inclusión de manera específica en los manuscritos que hacen uso de la morfometría (Fruciano, 2016; Muñoz-Muñoz y Perpiñan, 2010). La consideración de ser un proceso costoso en tiempo y recursos puede ser uno de los motivos que dificulte su aplicación. Sin embargo, su estudio permite indagar en la solidez acerca del conjunto de datos e inferir resultados a partir de estos, pudiéndose ver como una forma de ahorro de tiempo y recursos (Fruciano, 2016).
El análisis del error intermétodo debe ser tenido en cuenta en los casos en los cuales se tenga intención de combinar digitalizaciones provenientes de fuentes diferentes (Fruciano et al., 2017). La verificación de la compatibilidad de digitalizaciones de diversa procedencia es necesaria, no debiendo encontrarse diferencias significativas para proceder a su uso combinado. Los análisis realizados en este trabajo validan la posibilidad de utilizar conjuntamente archivos digitalizados mediante TC, escáner de superficie y fotogrametría; resultado que se suma a las evidencias previas (Brzobohatá et al., 2012; Buzi et al., 2018; Fruciano, 2016; Fruciano et al., 2017; Katz y Friess, 2014; Muñoz-Muñoz y Perpiñán, 2010; Robinson y Terhune, 2017; Shearer et al., 2017; Waltenberger et al., 2021), más si se tiene en cuenta la comparación entre las tres fuentes utilizadas en esta investigación (Fourie et al., 2011; Mathys et al., 2014). Por tanto, al no existir diferencias entre los métodos, los análisis de los datos de ellos derivados son comparables en cuanto a los resultados que se obtengan de su aplicación y, lo que es más interesante, combinables, pues no siempre todas las metodologías están disponibles en todos los lugares. Además, estos resultados apoyan la definición de punto de referencia como puntos anatómicos homólogos cuya descripción debe ser concisa y repetible (Bookstein, 1991). En cada cráneo analizado se registraron a lápiz los puntos de referencia antes de su digitalización por los tres métodos, pudiendo ser posteriormente visualizados al emplear fotogrametría. Sin embargo, en TC y escáner de superficie, la no texturización de la superficie hizo imposible su posterior visionado
En los estudios de error intraobservador se aprecian diferencias en cuanto al nivel de error. Los modelos fotogramétricos ofrecen resultados similares a los escáneres de superficie y TC (Buzi et al., 2018; Evin et al., 2016; Fourie et al., 2011; Fruciano et al., 2017; Hassett y Lewis-Bale, 2016; Katz y Friess, 2014; Mathys et al., 2014; Muñoz-Muñoz et al., 2016; Ortiz Sanz et al., 2010), pero con menor nivel de error que los derivados de las otras técnicas de digitalización. Esto no quiere decir que la fotogrametría sea más precisa per se; las fuentes del error pueden ser numerosas y han de evaluarse y corregirse en cada análisis (Fox et al., 2020; Fruciano, 2016). En este estudio, la fotogrametría se diferencia de las otras dos fuentes de digitalización por la texturización de la superficie y el registro con lápiz de los puntos sobre esta.
Los niveles de error son mayores en el análisis intermétodo. Resultado similar al observado por Evil et al. (2016) en un estudio de cinco cráneos de lobos digitalizados mediante fotogrametría y escáner; no así, en un análisis más reciente que ha mostrado el resultado contrario, tras analizar 23 cráneos de marsupiales macropódidos de diferentes especies tomados con dos escáneres laser diferentes y fotogrametría (Frucciano et al., 2017). La falta de evidencias acerca de este punto y los numerosos factores que pueden influir en el error y que han de ser tenidos en cuenta de manera particular en cada análisis (Fox et al., 2020; Frucciano, 2016), dificultan la discusión acerca de este asunto. Por otro lado, el error intermétodo suele ser inferior al interobservador (Balolia y Massey, 2021; Fox et al., 2020; Katz y Friess, 2014; Robinson y Terhune, 2017; Shearer et al., 2017); qué a su vez, suele ser mayor que el intraobservador (Balolia y Massey, 2021; Fox et al., 2020; Fruciano, 2016; Muñoz-Muñoz y Perpiñán, 2010; Shearer et al., 2017). Por lo tanto, el error interobservador sería mayor que cualquiera de los otros dos, observándose en nuestro caso que el error intermétodo es mayor que el intraobservador. El error interobservador puede llegar a tener fuertes efectos en los resultados y se recomienda evitar que la digitalización la realicen varios observadores, dada la elevada cantidad error que se puede generar (Fox et al., 2020).
En cuanto a los puntos de referencia, más allá de la problemática del registro en subadultos dado el desarrollo ontogénico de las estructuras craneanas (Barbeito-Andrés et al., 2012), varias son las características que dan lugar a variaciones en la colocación de estos en sujetos adultos. Como ya se indicó, los puntos de referencia tipo I y II presentan menor error (Fruciano, 2016; Katz y Friess, 2014 Muñoz-Muñoz y Perpiñán, 2010; Muñoz-Muñoz et al., 2016; Robinson y Terhune, 2017; Ross y Willians, 2008; Shearer et al., 2017; Sholts et al., 2011; Toneva et al., 2020; von Cramon-Taubadel et al., 2007), excepto casos puntuales (Sholts et al., 2011; Toneva et al., 2020). Este estudio es uno de esos casos puntuales, en los cuales los puntos tipo I como bregma o asterión presentan un mayor error; si bien, puede deberse a las otras características de los puntos de homólogos que dan lugar a variaciones. En primer lugar, la existencia de reabsorción, daño en la superficie o desdibujamiento de las suturas craneales dificulta la localización de puntos homólogos (Sholts et al., 2011). Aquellos que han de colocarse en lugares sensibles de sufrir obliteración y que, por ende, requieren de la visualización de la sutura y normalmente son puntos de referencia tipo I, presentan una menor precisión (Katz y Friess, 2014). Esta situación es la que nos hemos encontrado en este estudio. En segundo lugar, los puntos homólogos localizados en el neurocráneo suelen presentar una menor precisión, quizás por el elevado número de landamrks tipo I y más elevado aun de tipo III presente en este (Barbeito-Andrés et al., 2012; Toneva et al., 2020). Factor que también puede haber influido dado que los puntos que mayor error presentan se encuentran en el neurocráneo. En tercer lugar, los puntos homólogos hallados en la línea sagital suelen presentar menores errores (Schilcher et al., 2012), aunque este aspecto continúa en discusión, pues trabajos como el de Toneva et al. (2020) observaron recientemente lo contrario. En este caso, cuatro de los puntos que mayor error presentaron, bregma, lambda, basión y opisthión se encuentran sobre el plano sagital; aunque el error de los dos primeros creemos se debe al desdibujamiento de las suturas y el de los dos últimos debido a que, a pesar de tener una definición anatómica clara, al localizarse en una curva son más susceptibles de imprecisión. Enlazando de esta manera con la última característica que puede dar lugar a variación, que apunta que aquellos puntos homólogos localizados en curvas son más susceptibles de imprecisión que aquellos que muestran una definición anatómica clara (Schilcher et al., 2012). Por tanto, con respecto al bregma, se puede apuntar que el error observado se debe fundamentalmente a la obliteración de este punto en algunos sujetos; así pues, un punto de referencia tipo I que se sitúa en el plano sagital del neurocráneo, dado el desdibujamiento de las suturas, pasa de tener una definición clara a confusa. En el segundo del asterión, sea la ausencia de textura o baja resolución de los modelos de TC y escáner de superficie, no es posible apreciar la presencia de huesos wormianos en ese punto, lo que puede llevar a un registro erróneo del punto anatómico. En suma, se puede apuntar que el desdibujamiento por obliteración, reabsorción, remodelación o por daño de superficie, falta de texturización o baja resolución de la digitalización lleva a errores en el registro de los puntos homólogos sobre la superficie ósea.
La texturización permite la observación de esas características específicas de alto valor en el análisis, facilitando la identificación y colocación de los puntos homólogos (Jurda y Urbanová, 2016; Katz y Friess, 2014; Toneva et al., 2020). En este estudio, la fotogrametría fue la única técnica que presentaba texturización, cuya obtención también es posible observar en digitalizaciones realizadas con escáner de superficie, aunque la fotogrametría es la metodología que mejor textura genera (Mathys et al., 2004). A pesar de que los últimos avances de la fotogrametría y de los escáneres de superficie han mejorado la resolución y la recuperación de la textura; sin embargo, actualmente no podemos indicar cual es la que genera una textura de mayor resolución. Independientemente del instrumento que recupere la textura, existe un debate acerca de la influencia de esta en el error, siendo escasas las evidencias a este respecto (Toneva et al., 2020). Tal como se observa en este trabajo y señalan Toneva et al., (2020), el uso de la textura disminuye el error, mejorando la precisión; opinión contraria a la apuntada por Katz y Friess (2014). Es importante señalar que el nivel de resolución de la textura es muy relevante para la precisión en la identificación de puntos homólogos, llegándose a recomendar un cuidado especial en el uso de puntos de referencia tipo I en los modelos de baja resolución que dificultan la observación de caracteres específicos como las suturas (Tenova et al., 2020). Nuestro trabajo refuerza la importancia de considerar la textura al estudiar además estructuras con huesos supernumerarios, quedando descrito el error que estos elementos pueden conllevar si la textura no es tenida en cuenta.
El registro sobre la superficie de los puntos homólogos permite reconocer más fácilmente los landmarks y reducir el error (Chiari et al., 2008) tal como se aprecia en este trabajo. Se ha de tener en cuenta, que para poder identificar esos puntos sobre la superficie del cráneo es preciso que la digitalización presente textura, las digitalizaciones que no presentan textura impiden la visualización del registro sobre la superficie, tal como observamos en este estudio. El registro adecuado de los puntos de referencia sobre la superficie adquiere especial relevancia en aquellas superficies que presentan desdibujamiento, huesos supernumerarios o daños. En este sentido, pese a los logros conseguidos en facilitar a los investigadores herramientas que permitan alcanzar una resolución de la texturización de alta calidad, el reconocimiento macroscópico de los puntos homólogos continúa siendo inigualable, principalmente cuando este se acompaña del uso de lupa o el tacto para localizar los puntos de referencia. Es por ello, que este trabajo pone de manifiesto la importancia de considerar métodos que permitan la recuperación de la información premarcada sobre el material de estudio antes de la digitalización (fotogrametría en este trabajo ya que preservó la textura) en aquellos casos en los que sea crucial para la identificación de los puntos de referencia potenciando además el uso combinado de diversas metodologías (TC y escaner) en aquellos casos en los que los puntos anatómicos de interés no se encuentren comprometidos por la variabilidad interindividual de los sujetos a analizar.
En resumen, por un lado, la combinación de digitalizaciones provenientes de fuentes diversas es viable y la influencia en el análisis es baja, dando la oportunidad de incrementar los tamaños muestrales, permitiendo aumentar el poder estadístico de futuras investigaciones (Balolia y Massey, 2021; Fruciano et al., 2017; Kulmer, 2008; Kuzminsky y Gardiner, 2013 Robinson y Terhune, 2017; Waltenberger et al., 2021). Así pues, y tal como apuntan Waltenberger et al., (2021), a igual resultado entre fotogrametría y escáner de superficie, este último no ofrece ventajas y sí desventajas (pesado, coste y entrenamiento necesario); la TC interesa en tanto en cuanto el estudio de la estructura interna sea relevante. No obstante, el uso de archivos digitalizados con diferentes mecanismos a pesar de su baja influencia debe de ser tomado con precaución (Robinson y Terhune, 2017; Shearer et al., 2017) dado que puede oscurecer la variación de la forma de manera significativa y llevar a una clasificación errónea (Fox et al., 2020). Por lo tanto, y teniendo en cuenta las precauciones pertinentes, el uso de digitalizaciones de diverso origen, permite a numerosos campos del conocimiento (arqueología, bioantropología, zooarqueología, etc.) que aplican el abordaje geométrico analizar conjuntos muestrales mayores y con orígenes diversos, potenciando los estudios a desarrollar. Por otro lado, la textura y el registro de puntos de referencia sobre la superficie son relevantes en el nivel de error tal como se observa en este trabajo y anteriormente han apuntado otros autores (Chiari et al., 2008; Toneva et al., 2020). Se sabe que la textura permite apreciar características de alto valor en el análisis y facilita la identificación y registro de puntos homólogos (Jurda y Urbanová, 2016; Katz y Friess, 2014; Toneva et al., 2020). Así como, el registro sobre superficie permite reconocer más fácilmente los puntos de referencia y reducir el error (Chiari et al., 2008), situación que se reviste de mayor importancia en aquellos casos en los cuales se produce el desdibujamiento de la superficie ósea. Sin embargo, no sabemos si hay un factor predominante o ambos factores está jugando un peso similar en este resultado. Estos dos factores adquieren mayor relevancia si atendemos a la frecuente presencia de desdibujamientos de la superficie por motivos intrínsecos (obliteración, remodelación, reabsorción) o extrínsecos (daños de la superficie) y de huesos supernumerarios que presentan los restos esqueléticos humanos objeto de los estudios bioantropológicos. A futuro, sería interesante comprobar una vez texturizada la digitalización, si existen diferencias en el nivel de error entre una superficie registrada y otra que no lo esté. Y dada la relevancia de las diferencias observadas en la resolución de la textura (Toneva et al., 2020), realizar este mismo estudio con diferentes resoluciones de texturización, ya sea digitalizadas mediante escáner de superficie o fotogrametría.
Por último, es importante señalar las limitaciones que presenta este estudio. En primer lugar, la muestra analizada es escasa, es por ello por lo que se aplicaron tres análisis estadísticos diferentes a fin de cuantificar y visualizar el error, siguiendo las recomendaciones y pasos dados previamente por otros autores en el análisis del error. Por otro lado, tal como indican Fruciano (2016) y Waltenberger et al. (2021), aunque las estimaciones de error en muestras pequeñas son menos sólidas estadísticamente, se recomienda realizar este tipo de estudios con muestras piloto pequeñas, permitiendo gestionar el tiempo y los recursos de una manera más productiva. Así pues, encontramos numerosos estudios de error que usan muestras acotadas, menores de diez individuos (Balolia y Massey, 2021; Evil et al., 2016; Katz y Friess, 2014; Ross y Willians, 2008; Shearer et al., 2017; Toneva et al., 2020; Waltenberger et al., 2021, entre otros). En segundo lugar, y al igual que apuntan Toneva et al., (2020), la no realización de un estudio de error interobservador se puede considerar una limitación del trabajo, por más que se suela apuntar este tipo de error como superior a los dos estudiados en este trabajo e inclusive se apunte que este puede llegar a tener un efecto notable en los resultados (Fox et al., 2020).
CONCLUSIONES
La inexistencia de diferencias significativas entre las diversas fuentes de digitalización permite la utilización conjunta de archivos de diversa procedencia, guardando la precaución debida en cada caso. El error intraobservador en cada uno de los métodos de digitalización empleados no muestra diferencias significativas, no encontrándose variaciones entre las diferentes series realizadas. El error intraobservador de cualquiera de los métodos es inferior al intermétodo y, entre las fuentes de digitalización la que presenta un menor error es la fotogrametría, siendo el mecanismo más preciso, debiéndose a la texturización de la superficie y el marcado de los puntos homólogos sobre esta previamente al estudio. Si bien, desconocemos el peso de cada uno de estos factores, ambos influyen en una mayor precisión y en la reducción del nivel de error. A futuro sería interesante realizar estudios de error con una mayor muestra, teniendo en cuenta texturas provenientes de fuentes de digitalización diferentes, escáner de superficie vs. fotogrametría, diferentes resoluciones y variaciones entre los distintos softwares de dichas fuentes. De igual manera, se ha de testar la influencia específica del registro de puntos de referencia o no sobre la superficie ósea.