SciELO - Scientific Electronic Library Online

 
vol.26 número2Motivación, satisfacción e intenciones del turista náutico en la Ruta del Spondylus (Ecuador)Del paisaje a la estética del espacio turístico: Un estudio en centros históricos y costaneras del litoral del Estado de Paraná (Brasil) índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

  • No hay articulos citadosCitado por SciELO

Links relacionados

  • No hay articulos similaresSimilares en SciELO

Compartir


Estudios y perspectivas en turismo

versión On-line ISSN 1851-1732

Estud. perspect. tur. vol.26 no.2 Ciudad Autónoma de Buenos Aires abr. 2017

 

DOCUMENTOS DE BASE

Evaluación de destinos turísticos mediante la tecnología de la ciencia de datos

 

Carlos Mario Amaya Molinar*

Universidad de Colima - México

Pedro Magaña Espinoza**

Siteldi Solutions - Colima, México

Ileana Ochoa Llamas***

Universidad de Colima - México

* Licenciado en Sociología por la Universidad Nacional Autónoma de México, México D.F.; Maestro en Finanzas por la Universidad de Colima, Villa de Álvarez, México; Doctor en Turismo, Derecho y Empresa por la Universidad de Girona, España. Se desempeña como Profesor Investigador en la Facultad de Turismo de la Universidad de Colima. E-mail: cmamaya@ucol.mx

** Ingeniero en Telemática y Maestro en Computación por la Facultad de Telemática de la Universidad de Colima, Colima, México. Se desempeña como Director General de Siteldi Solutions, S. A. de C. V., Colima, México. E-mail: pedro.magana@siteldisolutions.mx

*** Licenciada en Administración de Servicios Turísticos y Maestra en Finanzas por la Universidad de Colima, Villa de Álvarez, México. Se desempeña como Profesora Investigadora en la Facultad de Turismo de la Universidad de Colima. E-mail: ileana8a@ucol.mx


Resumen:

Se presentan resultados de un estudio exploratorio aplicando una metodología de Big Data a dos destinos turísticos mexicanos, utilizando la modalidad de análisis de sentimientos y opiniones en comentarios publicados en línea sobre cuatro modalidades de servicios turísticos: atractivos turísticos, hospedaje, alimentos y bebidas y transporte. La metodología emite evaluaciones positivas, negativas y neutrales sobre cada uno de los establecimientos y servicios analizados; los datos se tomaron de los blogs turísticos TripAdvisor y VirtualTourist. En los servicios analizados, los resultados muestran que, en general, Los Cabos obtiene más comentarios positivos que Cancún, con excepción de los servicios de transporte, que presentan resultados negativos en ambos destinos turísticos. Más que enfocarse en los aspectos generales presentados en los trabajos tradicionales sobre imagen y competitividad de los destinos turísticos, la metodología empleada aporta resultados puntuales sobre tipos de servicios, atractivos y establecimientos. Los resultados preliminares resultaron satisfactorios y la metodología puede aplicarse a otros destinos y servicios turísticos.

PALABRAS CLAVE: Destinos turísticos; Big Data; Competitividad; Imagen; Experiencia de visita.

Abstract:

Evaluation of Tourist Destinations with Data Science Technology.

The article presents results of an exploratory study applying a methodology of Big Data in two Mexican tourist destinations, using the method of analysis of sentiments and opinions in reviews published online on four kinds of tourist services: tourist attractions, lodging, food and beverages and transport. The methodology produces positive, negative and neutral assessments on each of the establishments and services analyzed; data were taken from tourist blogs TripAdvisor and VirtualTourist.  In the services analyzed , the results show that, overall, Los Cabos gets more positive feedback than Cancun, with the exception of transport services, showing negative remarks in both destinations. Rather than focusing on the general aspects presented in the traditional work on image and competitiveness of tourist destinations, the methodology provides precise results about types of services, attractions and facilities. Preliminary results were satisfactory; the methodology can be applied to other tourist destinations and services.

KEY WORDS: Tourist destinations; Big Data; Competitiveness; Image; Visit experience.


INTRODUCCIÓN

El presente trabajo forma parte de los proyectos de innovación tecnológica titulados "Desarrollo de un sistema experto de evaluación de destinos turísticos y promoción" y "Desarrollo de un sistema gestor de destinos turísticos para impulsar la competitividad a través del e-turismo", apoyados por el Programa Estímulos a la Innovación 2015 y 2016 del Consejo Nacional de Ciencia y Tecnología, con números de proyecto 220227 y 230292. El propósito de los proyectos es crear indicadores que reflejen sentimientos de consumidores precedentes y proporcionar información para apoyar las decisiones de los turistas en el proceso de seleccionar destinos turísticos y servicios específicos. En el proyecto participaron la Facultad de Turismo de la Universidad de Colima, Siteldi Solutions, S. A. de C. V. y el Centro de Tecnología Avanzada CIATEQ Querétaro.

La investigación es exploratoria, ya que se pone a prueba la metodología. En la primera parte del trabajo se revisan términos como destino turístico, experiencia de visita, competitividad y agentes interesados; la segunda parte del documento analiza temas relacionados con la ciencia de datos, análisis de texto, análisis de sentimientos y opiniones y redes sociales; el tercer apartado presenta un conjunto de estudios académicos realizados con aplicaciones de Big Data en temas de servicios y destinos turísticos; la cuarta parte presenta la metodología del trabajo; enseguida se dan a conocer los resultados del estudio empírico y en el último apartado se discuten los resultados y se formulan las conclusiones. El estudio se aplica a dos destinos turísticos mexicanos.

LA EXPERIENCIA DE VISITA AL DESTINO TURÍSTICO

El destino turístico se ha definido como un conglomerado de localidades, atractivos y servicios ubicado en un área geográfica delimitada y con cultura propia, en la cual una red social de operadores turísticos públicos y privados colabora con la comunidad y con agentes externos para producir una experiencia turística que resulta satisfactoria para los visitantes, generando una imagen que motiva a los residentes externos a visitarlo (Amaya, 2012).

En el estudio contemporáneo de los destinos turísticos se abordan tres temas esenciales relacionados con su éxito económico, ecológico y social: la competitividad, la sostenibilidad y la comercialización. Numerosos trabajos académicos profundizan en el estudio de sus variables, entremezclándolas y traslapándolas. Para algunos autores, los atractivos turísticos, la naturaleza y la oferta de hospedaje son atributos de la imagen del destino, mientras que otros los consideran factores de competitividad o sostenibilidad.

Considerando lo anterior, este trabajo se enmarca en el campo de estudio de la competitividad de los destinos. Se han publicado diversos trabajos académicos que aplican la ciencia de datos para estudiar la imagen de un destino turístico, pero no se logró identificar algún trabajo que estudie su competitividad; así, este estudio presenta la primera aplicación de la ciencia de datos para el estudio de la competitividad de destinos turísticos.

Un concepto sencillo de competitividad es el de Enright & Newton (2004: 778): "Un destino turístico es competitivo si puede atraer y satisfacer turistas potenciales"; estos autores hacen énfasis en la atractividad (la capacidad de un sitio para atraer visitantes), en los recursos núcleo y la imagen del destino como razones principales de los turistas para elegir su destino de viaje. Pike (2012) y Chen & Phou (2013) consideran que un destino turístico debe proveer un atractivo general y experiencias de calidad que sean iguales o mejores que aquellas de los destinos competidores.

La Comisión Europea describe al destino turístico como un conjunto de productos que integran la experiencia turística, suministrados por un conjunto de actores (tour operadores, hoteleros, transportistas, restauranteros, etc.) que cooperan entre sí, derivando la ventaja competitiva del destino del funcionamiento del sistema de actores locales (Capone, 2006). Por su parte, Ritchie & Crouch (2005) plantean que las personas que visitan un destino turístico lo hacen buscando experiencias memorables con calidad total; definiendo a los destinos turísticos como proveedores de experiencias placenteras y memorables para los visitantes, produciendo elevados niveles de satisfacción que generen comentarios favorables.

Analizando la experiencia turística, Crouch (2000) destaca la enorme complejidad de la experiencia de visita al destino, que concentra el resultado de una colección de servicios comerciales y no comerciales, producidos por empresas privadas y organizaciones gubernamentales o no lucrativas, lo cual impide que se les apliquen controles de calidad que pueden gestionarse en los servicios operados por empresas individuales (Figura 1).


Figura 1: Distribución regional de los segmentos y actividades turísticas en entornos marítimos y fluviales

La experiencia de visita al destino turístico es producida por un conjunto de actores de diversas categorías que la literatura académica denomina agentes interesados ("stakeholders"). Kotler et al. (2003) definen a los interesados como agentes de riesgo, esto es, conjunto de actores que detentan intereses, participación o inversiones en asuntos determinados y pueden poner en riesgo la operación de una organización; entre ellos incluye a trabajadores, proveedores, clientes, la comunidad, el público y diferentes tipos de grupos de interés. Ritchie & Crouch (2005) enumeran 32 tipos de agentes interesados capaces de influir en el desempeño de un destino turístico y su DMO, aunque no todos con el mismo poder e influencia; entre estos se encuentran operadores de hoteles, restaurantes, atractivos turísticos, servicios de transporte, comerciantes, empleados gubernamentales, guías de turistas, etc.

Claver-Cortés, Molina-Azorín & Pereira-Moliner (2007) y Molina-Azorin, Pereira-Moliner & Claver-Cortés (2010), han demostrado que el nivel de desempeño conjunto de las empresas hoteleras de un destino turístico influye en su competitividad general, destacando que la competitividad de las empresas se vincula con la del destino: mientras más competitivas sean las empresas de un destino turístico, más competitivo será éste.

Algunos autores han puntualizado que la característica más básica del fenómeno llamado turismo es la entrega de experiencias positivas a los turistas. Pizam (2010: 343) señala que "la creación de experiencias memorables es la esencia y la razón de ser de la industria de la hospitalidad". Las experiencias memorables satisfactorias son consideradas fuentes de intenciones conductuales positivas, como disposición de revisitar y recomendaciones a familiares y amigos.

DEFINICIÓN Y CARACTERÍSTICAS DEL BIG DATA

Big Data es un término empleado coloquialmente para referirse a las aplicaciones de ciencia de datos; mucho se dice actualmente sobre este tema, pero, ¿qué significa específicamente Big Data? La Comisión Federal para Big Data del gobierno de Estados Unidos de América lo define de la siguiente manera:

Big Data es un término que describe grandes volúmenes de datos complejos, variables y a alta velocidad, que requieren técnicas y tecnologías avanzadas para su captura, almacenamiento, distribución, gestión y análisis de la información (Tech America Foundation's Federal Big Data Commission, 2012).

Algunas estadísticas sobre el uso de Internet indican que Google reúne diariamente más de un billón de búsquedas, Twitter registra más de 250 millones de tweets, Facebook más de 800 millones de actualizaciones y YouTube más de 4 billones de vistas. Todos los días se producen 2.5 quintillones de bytes y 90 % de los datos existentes en el mundo se crearon en los dos últimos años (Fan & Bifet, 2013). Gartner (2015), empresa líder en investigación de tecnología, considera que el Big Data llegó para quedarse; su valor deriva de sus múltiples aplicaciones científicas, comerciales y de gestión. Para facilitar la comprensión de este fenómeno informático se utiliza la figura de las "5 V's": volumen, variedad, velocidad, veracidad y valor.

El Big Data se integra en la tercera plataforma de la industria de la información, con la computación en la nube, el Internet móvil y los negocios sociales, pronosticándose un volumen económico de $ 5.3 trillones de USD y el 90 % del crecimiento de la industria de las TIC's (Jin et al., 2015). En el campo de la ciencia, el Big Data ha disparado una revolución en el pensamiento y en la metodología de investigación, generando un nuevo paradigma de obtención de información que no exige a los investigadores acceder directamente a su objeto de estudio, pues pueden emplearse técnicas automatizadas de minería de datos para obtener información, conocimiento e inteligencia; generando un campo de estudios emergente denominado ciencia de los datos, orientada a extraer conocimiento de los datos en forma multidisciplinaria (Loukides, 2011).

La gestión de Big Data presenta necesidades específicas. La integración de los datos representa el 80 % de un proyecto de Big Data, lo cual implica obtener los datos, ordenarlos sintácticamente, normalizarlos, estandarizarlos, integrarlos, limpiarlos, extraerlos, combinarlos, clasificarlos y distribuirlos (Reeve, 2013). El potencial del Big Data sólo se realiza cuando se aprovecha para la toma de decisiones, aplicando técnicas que conviertan elevados volúmenes de datos a alta velocidad en conocimiento significativo, proceso que puede ilustrarse en la Figura 2.


Figura 2: El proceso de Big Data
Fuente: Adaptado de Gandomi & Haider (2015)

Una computadora de escritorio es insuficiente para la cantidad de datos procesados en la minería de datos; para este fin, es necesario emplear equipos de alto rendimiento o integrar clústeres de computadoras. Un sistema de procesamiento de Big Data mezcla componentes de hardware y software avanzados que difícilmente pueden lograrse sin el apoyo financiero y tecnológico suficiente.

Análisis de texto

El análisis o minería de texto usa técnicas que extraen información de fuentes como correos electrónicos, foros en línea, blogs, respuestas de encuestas, documentos corporativos, noticias, registros de centros telefónicos y declaraciones en redes sociales. Este proceso incluye análisis estadístico, lingüística computacional y aprendizaje de máquinas; permite a las organizaciones convertir grandes volúmenes de texto generado por las personas en resúmenes significativos para la toma de decisiones.

Las técnicas de análisis de sentimientos (minería de opiniones) examinan textos que contienen las opiniones de las personas sobre objetos como productos, organizaciones, individuos y eventos. Estas técnicas se clasifican en tres niveles: de documento, de frase y de tema, buscando identificar la polaridad positiva o negativa de las declaraciones o escalas de sentimientos, como los sistemas de evaluación de cinco estrellas de Amazon o Expedia (Feldman, 2013).

Análisis de medios sociales

Los medios sociales comprenden una variedad de plataformas en línea que permite a los usuarios crear y compartir contenidos e interactuar socialmente (Gundecha & Liu, 2012); pueden clasificarse en las siguientes categorías: redes sociales (Facebook y LinkedIn), blogs (Blogger, Wordpress), microblogs (Twiter y Tumblr), noticias sociales (Digg y Reddit), separadores (Delicious y StumbleUpon), medios compartidos (Instagram y YouTube), sitios de preguntas y respuestas (Yahoo! Answers y Ask.com), sitios con evaluaciones (Yelp y TripAdvisor) y sitios con apps para teléfonos como "Find My Friend".

Los medios sociales son uno de los canales de marketing con mayor crecimiento en la actualidad (He et al., 2013). Los contenidos generados por los usuarios (UGC: sentimientos, imágenes, videos, etc.) y las interacciones entre los agentes de la red (personas, organizaciones y productos) son las dos fuentes de información en los medios sociales, con contenido frecuentemente voluminoso, desestructurado y dinámico; su análisis puede emplearse para generar conocimiento.

El análisis de sentimientos o minería de opiniones analiza expresiones de las personas tales como opiniones, sentimientos, evaluaciones, actitudes, emociones y valoraciones sobre entidades como productos, servicios, organizaciones, individuos, asuntos, eventos, tópicos y sus atributos. El surgimiento y rápido crecimiento de este campo de estudios corresponde con el auge de los medios sociales en Internet; por primera vez en la historia se dispone de un gran volumen de datos y opiniones registrado digitalmente (Liu, 2012). El análisis de sentimientos plantea importantes retos: los sujetos pueden presentar simultáneamente comentarios negativos y positivos u opiniones contradictorias, situación normal para las personas, pero no para las computadoras. De la misma manera, las personas pueden asignar una evaluación elevada en términos de escalas o estrellas en sitios como TripAdvisor o Expedia y, simultáneamente, expresar un comentario negativo.

Con un resumen de opiniones, un consumidor puede compartir las percepciones de clientes que adquirieron un producto y el productor puede conocer las características de los productos que agradan o desagradan a los consumidores; si se desea comprar un producto ya no es necesario preguntar a un familiar o vecino, pueden obtenerse evaluaciones y reseñas en la Web; las organizaciones tampoco requieren hacer encuestas o estudios de opinión. Sin embargo, la gran cantidad de sitios y volúmenes de opinión obligan a utilizar sistemas automatizados para recabar y analizar la información disponible en Internet. Technorati estima que diariamente se crean 75,000 nuevos blogs con 1.2 millones de publicaciones, muchas de ellas discutiendo opiniones sobre productos y servicios; el 60 % de los estadounidenses han investigado productos en línea (Kim, 2006).

APLICACIONES DE BIG DATA EN ESTUDIOS SOBRE TURISMO

En años recientes se han incrementado los casos de aplicaciones de Big Data en diversas publicaciones académicas, institucionales y empresariales, la mayoría de ellos experimentales. Liu (2012) enumera un conjunto de estudios basados en Twitter y blogs en diversos campos académicos y comerciales, entre los que se encuentran la relación entre opiniones y apuestas a equipos de la NFL; análisis de sentimientos para pronosticar resultados en elecciones; pronóstico de ventas en taquilla mediante datos de Twitter, blogs y reseñas cinematográficas; pronóstico de desempeño del mercado accionario analizando estados de ánimo detectados en Twitter y predicción de epidemias de influenza empleando consultas en motor de búsqueda (Google).

Se identificaron aplicaciones de Big Data al estudio del turismo en trabajos sobre servicios y destinos turísticos. Para determinar el papel de los medios sociales en las búsquedas sobre viajes por los consumidores, Xiang y Gretzel (2010) replicaron los pasos normales que sigue un consumidor al planear su viaje en Internet, demostrando que los medios sociales son parte esencial de las herramientas de búsqueda (Figura 3). En relación con los proyectos objeto del presente estudio, el trabajo de Xiang & Gretzel (2010) resaltan la gran importancia que reviste la consulta de evaluaciones durante el proceso de planeación de los viajes (27 %), al igual que la participación en blogs y comunidades virtuales.


Figura 3: Medios sociales consultados por los consumidores para planear viaje
Fuente: Adaptado de Xiang & Gretzel (2010)

Xiang et al.  (2015) estudiaron la relación entre la experiencia del huésped y la satisfacción analizando evaluaciones publicadas en Expedia.com, identificando una fuerte correlación entre ambas variables. Se recopilaron más de 60 mil evaluaciones de consumidores sobre más de 10.000 hoteles de las 100 ciudades más grandes de Estados Unidos. Pan et al. (2012) estudiaron el volumen de consultas en Internet para predecir la demanda de habitaciones hoteleras en destinos turísticos, obteniendo resultados más precisos que los métodos de pronóstico tradicionales. Las consultas en Internet, las reservaciones de hotel y de vuelos de los turistas pueden monitorearse en diversos servidores y motores de búsqueda; los viajeros dejan rastros en forma de volúmenes de consulta que constituyen indicadores de interés. Así, consultando los datos de comportamiento en línea, empresas y gobiernos pueden pronosticar ventas, ocupación y patrones de consumo de los turistas.

Davenport (2013) identifica al Big Data como una tecnología disruptiva que puede beneficiar a cualquier organización; lo describe como un río de información que fluye rápidamente y nunca se detiene; propone a las empresas formular estrategias para su adopción. Entre las empresas turísticas pioneras en la adopción de Big Data menciona a Kayak, Marriott, Amadeus, Hipmunk, British Airways y el aeropuerto de Munich.

Varias empresas de telecomunicaciones han empleado aplicaciones de Big Data para encuestar a empresas turísticas y visitantes, así como mapas de geolocalización de turistas en los Países Bajos, en Italia y en España (Heerschap et al., 2014; Girardin et al., 2008; RocaSalvatella & Telefónica, 2014). Stepchenkova et al. (2009) utilizan análisis de texto aunado a análisis factorial exploratorio para estudiar la imagen de destino turístico de Rusia.

Pan et al. (2007) investigan la imagen de Charleston, Carolina del Sur, analizando textos publicados en blogs de viajes. El software NVivo les permitió detectar las menciones positivas o negativas de los blogueros sobre un conjunto de atributos de la imagen de destino, determinando que la mayor fortaleza de Charleston son sus atracciones: la historia, su ambiente hospitalario y sus atracciones acuáticas. Las principales quejas se refieren al acceso a la ciudad, a su infraestructura de transporte, al tránsito vehicular, al hospedaje y alimentos y bebidas. Fedele et al. (2011) emplean contenido generado por los usuarios en los medios sociales para estudiar la imagen de destino turístico de Malta.

Estudiando la imagen de destino de Tallin, Estonia, Dickinger et al. (2011) emplean un procedimiento paralelo, analizando el contenido de publicaciones de turistas en blogs y guías de viajes en Internet con una encuesta aplicada a visitantes, reportando que la mayoría de los temas estudiados convencionalmente en la imagen de destino turístico aparecen en el estudio en línea.

Rossetti et al. (2015) analizan evaluaciones de servicios turísticos en línea en dos enfoques: desde los temas que destacan por las menciones de los usuarios en sus evaluaciones o desde los temas que los investigadores exploran mediante análisis de contenido, definiendo al modelo de criterio de tópicos como un enfoque estadístico de aprendizaje de máquinas que extrae información temática de extensos documentos de lenguaje natural.

El trabajo de Serna et al. (2015) emplea un proceso automatizado para analizar los componentes cognitivo, afectivo y conativo de la imagen de destino turístico del País Vasco a partir de publicaciones en la comunidad de experiencias de viajes www.minube.com. Los resultados del trabajo ubican a los recursos naturales y culturales como las dimensiones con mayor influencia en la imagen de destino turístico. Marine-Roig & Clave (2015) emplearon un método que descarga, limpia y procesa automáticamente la información, analizando el contenido de 85.000 reseñas de turistas que visitaron Cataluña entre 2004 y 2013 en 4 blogs de viajes: TripAdvisor, TravelBlog, VirtualTourist y TravelPod. Estos autores utilizan un conjunto de recursos en línea y software de libre acceso, concluyendo que la metodología puede emplearse para diversos sitios, idiomas y temas, aportando información relevante para que las oficinas de gestión de destino conozcan el posicionamiento de sus marcas a través de sentimientos y opiniones publicados por turistas en blogs de viajes.

Fuchs et al. (2014) probaron el Sistema de Información para la Gestión del Destino (DMIS) en Åre, Suecia, aplicando un enfoque de inteligencia de negocios para aprendizaje organizacional en destinos turísticos. El sistema aportó información en tiempo real sobre indicadores en tres campos: de desempeño económico, con datos sobre ocupación, precio, estancia, reservaciones y ventas; en el campo de comportamiento del consumidor, analizaron su perfil, navegación por la web y proceso de compra; finalmente, en la gestión de marcas, se analizaron lealtad, valor, satisfacción y conciencia de marca.

Se advierte un proceso evolutivo en los estudios de análisis de contenido y de medios sociales sobre destinos turísticos desarrollados por Pan et al. (2007), Stepchenkova et al. (2009), Fedele et al. (2011), Dickinger et al. (2011) y Rossetti et al. (2015), que si bien logran su propósito de analizar la percepción de los atributos de la imagen de destino turístico, pueden considerarse "artesanales" (Lu & Stepchenkova, 2014), por los métodos de captura, limpieza y procesamiento de datos aplicados. En cambio, los trabajos desarrollados por Fuchs et al. (2014), Marine-Roig & Clave (2015) y Serna et al. (2015) presentan un salto cualitativo, pues los procesos de extracción, limpieza, procesamiento y análisis de los datos se realizan mediante procesos automatizados

METODOLOGÍA DEL ESTUDIO

El análisis de sentimientos se ha definido como el proceso de detectar la polaridad contextual de un texto; esto es, se determina si un fragmento de texto es positivo, negativo o neutral (Palakvangsa et al., 2011). Una definición alternativa es minería de opiniones, ya que deriva de la opinión o la actitud de quien se expresa; este procedimiento se usa comúnmente para conocer el sentimiento de la gente sobre algún tema particular; ambos términos se han empleado como sinónimos, aunque la expresión análisis de sentimientos se emplea para definir aplicaciones específicas orientadas a clasificar reseñas atendiendo a su polaridad. Así, un sentimiento positivo identifica simpatizantes y comunidades donde la marca o producto es bien aceptado; un sentimiento neutral permite a las organizaciones comprender las declaraciones sobre temas que deben reforzarse, mientras que los sentimientos negativos ayudan a las organizaciones a comprender aquellos aspectos que requieren apoyo directo para mejorar su percepción (Solís & Martínez, 2015).

Siguiendo a Liu (2012), en el análisis de sentimientos deben considerarse los siguientes parámetros: el objeto de sentimiento, que es la entidad sobre la que se comenta; el opinante, persona u organización que se expresa; la orientación, que puede ser positiva, negativa o neutra hacia el objeto o sus características; el objeto modelo, representado por un conjunto finito de características; el documento modelo de opiniones, que contiene opiniones sobre un conjunto de objetos y, finalmente, el objetivo del análisis de sentimientos, que es descubrir toda la información sobre los parámetros mencionados.

La experiencia de viaje es definida por Tung & Ritchie (2011) como la evaluación subjetiva de eventos relacionados con las actividades turísticas ocurridas a un individuo antes, durante y después de un viaje. Los indicadores de sentimientos deberán aportar información sobre servicios turísticos en apoyo a la toma de decisiones en cualquier etapa del viaje, articulando el uso de Internet por los turistas en tres etapas (Figura 4).


Figura 4: Uso de internet por turistas antes, durante y después del viaje
Fuente: Elaboración propia

En el presente estudio se buscaron indicadores de sentimientos manifestados por los turistas en los blogs turísticos TripAdvisor y VirtualTourist sobre cuatro objetos: atractivos, hospedaje, restaurantes y transporte en los destinos turísticos seleccionados. Barros et al. (2011), Huang  & Peng (2012), Caber et al. (2012), Enright & Newton (2004, 2005), Cracolici & Nijkamp (2008) y Andrades-Caldito et al. (2013) mencionan a los atractivos turísticos, la oferta de hospedaje, la infraestructura de transporte y a la cocina local o gastronomía entre los factores determinantes de la competitividad de los destinos turísticos.

El diseño tecnológico integra un clúster Hadoop de 10 computadoras asociadas en forma de anillo, con la décima integrada como nodo semilla, con una estructura de procesamiento compuesta por diversos paquetes de software (Figura 5). Se utiliza software conocido como "web crawler" o "bot" para explorar páginas web de dominio público. Los crawlers consultan las páginas web y siguen sus vínculos, al igual que hacen las personas al navegar por el contenido de la Web, van de un vínculo a otro y recopilan datos sobre esas páginas web. El crawling o rastreo inicia en las denominadas páginas semilla; el software Nutch descarga las páginas identificadas mediante los URLs (Uniform Resource Locator) definidos; la información requerida se obtiene  en las páginas seleccionadas (Figura 5).


Figura 5: Ejemplo de información tomada de TripAdvisor
Fuente: Adaptado de TripAdvisor

Los datos obtenidos de las páginas, en este caso, los comentarios, son procesados por una librería que determina si un comentario es negativo, positivo o neutral. Enseguida, los resultados se almacenan en una base de datos, clasificándolos por destino turístico, hotel, restaurante, atractivo o servicio de transporte a los que corresponden. Una vez almacenados, es posible obtener información útil de los datos relacionándolos con el destino turístico. Para determinar si los comentarios sobre los objetos seleccionados son positivos, negativos o neutros se empleó la API (Application Programming Interface) suite Stanford CoreNLP 3.3.1, librería de proceso de lenguaje natural (NLP) que aplica un conjunto de herramientas de análisis lingüístico a fragmentos de texto para examinar los sentimientos que contiene.

ESTUDIO EMPÍRICO

Se presenta en este trabajo el primer lote de información generado por el sistema experto el 13 de diciembre de 2015. Para probar la tecnología se decidió comparar la información sobre atractivos turísticos, empresas de hospedaje, empresas de alimentos y bebidas y servicios de transporte en dos de los destinos turísticos de sol y playa más importantes de México: Cancún, Quintana Roo y Los Cabos, Baja California Sur, el primero localizado en la península de Yucatán, sobre el mar Caribe y el segundo localizado en el extremo de la península de Baja California, sobre el océano Pacífico. Ambos destinos turísticos comparten la característica de haber sido desarrollados como "centros turísticos integralmente planeados" por el Fondo Nacional de Fomento al Turismo en la década de 1970. La comparación de destinos es una práctica común en los estudios sobre competitividad turística, por la naturaleza misma del tema (Blanke & Chiesa, 2013; Cracolici & Nijkamp, 2008; Enright & Newton, 2004; 2005). Además de presentar un origen común y de ubicarse geográficamente en el extremo de enormes penínsulas, frente a dos océanos distintos, se considera que Cancún y Los Cabos compiten entre sí, al ser algunos de los destinos de sol y playa nacionales que más turistas internacionales reciben. En años recientes, el destino bajacaliforniano se promueve como un destino elitista, de gama alta, frente a la masificación registrada en el destino caribeño.

Los datos se obtuvieron de comentarios formulados en inglés en los blogs de viajes de TripAdvisor y VirtualTourist; estos blogs fueron elegidos por la gran cantidad de información y evaluaciones que presentan: en 2015, el primero registró 350 millones de evaluaciones sobre más de 6,5 millones de establecimientos turísticos (Tripadvisor, 2016), mientras que el segundo cuenta con más de un millón de miembros registrados en 220 países (VirtualTourist, 2016). Adicionalmente, ambos blogs presentan información categorizada de manera similar, sobre alojamientos, atractivos, restaurantes, etc. Se decidió analizar las reseñas expresadas en inglés considerando que el software para análisis de sentimientos y opiniones se encuentra más desarrollado en ese idioma que en español. El comparativo de datos turísticos presentado en la Tabla 1 muestra como Cancún recibe casi seis veces más turistas que Los Cabos, con una mayor tasa de ocupación, mientras que el destino bajacaliforniano recibe considerablemente más turistas extranjeros con mayor duración en su estancia.

Tabla 1: Indicadores turísticos de Cancún y Los Cabos, 2014
Fuente: Secretaría de Turismo (2015)

La Tabla 2 presenta los registros por categoría de servicios turísticos y por destino turístico, mostrando el acumulado general de comentarios obtenidos durante la primera corrida del sistema, con 1.392 registros para Los Cabos y 462 para Cancún. Los registros se refieren a establecimientos o servicios sobre los que existen comentarios en línea; cada registro contiene una o más declaraciones que pueden ser positivas, negativas o neutrales. Se obtuvieron considerablemente más registros sobre Los Cabos que sobre Cancún, a pesar de que éste destino recibió más visitantes. Una revisión de los registros muestra que, en términos generales, se presentan más sentimientos positivos sobre los servicios consumidos en Los Cabos frente a más sentimientos negativos para Cancún, con excepción de los servicios de transporte, que resultan negativos para ambos destinos.

Tabla 2: Registros de sentimientos por categoría de servicios y destino turístico
Fuente: Elaboración propia

Las Figuras 6 y 7 presentan ejemplos de la información capturada en las bases de datos una vez que se ha obtenido, limpiado y procesado la información mediante la metodología diseñada en el presente proyecto.


Figura 6: Muestra de base de datos de sentimientos sobre transporte, Cancún
Fuente: Elaboración propia


Figura 7: Muestra de base de datos de sentimientos sobre atractivos, Los Cabos
Fuente: Elaboración propia

CONCLUSIONES

El presente estudio difiere de los trabajos sobre destinos turísticos mediante aplicaciones de Big Data comentados anteriormente por su enfoque en la competitividad; los trabajos de Pan et al. (2007), Stepchenkova et al. (2009), Fedele et al. (2011), Dickinger et al. (2011), Rossetti et al. (2015), Fuchs et al. (2014), Marine-Roig & Clave (2015) y Serna et al. (2015) se enfocan en el estudio de la imagen de destino, aunque los resultados comparten algunos componentes. De la misma manera, los trabajos comentados aplican técnicas de análisis de texto, mientras que el presente trabajo emplea una técnica de minería de opiniones, enfocada en identificar la polaridad de un comentario, determinando si es positivo, negativo o neutral.

Los trabajos mencionados obtienen resultados más abstractos, aplicables a atributos del destino en general. En cambio, en el presente estudio, los resultados recaen directamente sobre las diversas organizaciones del destino, representativas de sus agentes interesados. Así, por ejemplo, llama la atención que los servicios de transportes de ambos destinos obtienen resultados claramente negativos (Tabla 2), lo que repercute directa y negativamente sobre su imagen y competitividad.

Desde el punto de vista de la gestión del destino turístico, la metodología empleada permite identificar con toda claridad a aquellos servicios, establecimientos y agentes interesados que contribuyen a mejorar la imagen y la competitividad del destino, como a aquellos que inciden en su deterioro, dañando la imagen de sus pares operadores de servicios.

El conocimiento de los resultados por categoría de servicio podría conducir al establecimiento de acuerdos de colaboración entre agentes interesados para mejorar sus resultados, que con seguridad se vinculan con comentarios sobre la calidad y la satisfacción con los servicios consumidos que, a su vez, influyen en las intenciones conductuales. Operando en un destino masificado en etapa de madurez, los agentes interesados de Cancún deberían preocuparse por la mayor proporción de comentarios negativos publicados en las redes sociales.

Atendiendo a los eslabones en la cadena de experiencia de visita al destino turístico propuesta por Crouch (2000) e ilustrada en la Figura 2, la cadena de servicios de Cancún presenta serias carencias que, en el largo plazo, incidirán negativamente en su imagen de destino. Siguiendo a Claver-Cortés, Molina-Azorín & Pereira-Moliner (2007) y a Molina-Azorin, Pereira-Moliner & Claver-Cortés (2010), los resultados del trabajo pueden servir como punto de partida para que las diversas organizaciones públicas y privadas dedicadas a la operación de los destinos turísticos examinen su desempeño y formulen estrategias para mejorar la calidad de los servicios en su conjunto, para elevar así, consecuentemente, la calidad de experiencia de visita en todo el destino.

El presente trabajo no está exento de limitaciones; la principal, que es el primer lote de información obtenido mediante la aplicación de ciencia de datos diseñada, por lo que es necesario generar datos con mayor frecuencia y continuidad para producir resultados más concluyentes. En lo que se refiere a investigaciones futuras, resultará de gran interés profundizar en el análisis de los comentarios puntuales formulados para cada registro, a fin de conocer los contenidos positivos, negativos o neutros sobre los servicios, aunque este proceso constituirá una nueva etapa de investigación, con métodos de investigación distintos.

En el campo de las implicaciones gerenciales, los resultados generados mediante la tecnología presentada en este trabajo permite a los encargados de la gestión de los destinos turísticos y a las diversas categorías de agentes interesados establecer acuerdos para la mejora general de la calidad de los servicios mediante programas de capacitación, certificación o introducción de tecnología. Por otra parte, la aplicación también permite identificar a aquellos servicios cuyo desempeño deficiente incide negativamente en la imagen y competitividad del destino. Como mencionan Claver-Cortés, Molina-Azorín & Pereira-Moliner (2007) en su trabajo sobre Benidorm, entre los factores que han permitido a este destino mediterráneo conservar su competitividad en el largo plazo se encuentran los acuerdos establecidos entre empresarios turísticos para mantener la calidad de sus servicios.

La aplicación tecnológica cuyos resultados se presentan en este documento puede aplicarse a cualquier destino del mundo y de cualquier modalidad, aunque es un requisito indispensable que el destino estudiado cuente con una presencia sustancial en línea y que su afluencia de visitantes genere los comentarios suficientes para ser analizados mediante la ciencia de datos. En caso de no existir datos suficientes, se debe recurrir a métodos tradicionales como la aplicación de encuestas. Los resultados preliminares del trabajo resultaron satisfactorios, aunque es recomendable avanzar en el desarrollo de la tecnología; actualmente se trabaja en la segunda etapa del proyecto, orientada al desarrollo de un sistema para la gestión de destinos turísticos.           

En su estado actual de desarrollo, la tecnología no registra el momento preciso en que se publicaron las evaluaciones de los turistas, aunque puede suponerse que se realizaron durante o después del viaje. En este contexto, el momento de publicación de las evaluaciones puede plantearse como una propuesta de mejora, aunque tecnológicamente puede resultar complicado, pues, por ejemplo, TripAdvisor sólo menciona "hace 3 días", "hace una semana". Para concluir, es evidente que, en su estado actual, al igual que ocurre con trabajos similares consultados durante la revisión de la literatura (Marine-Roig & Clave, 2015; Fuchs et al., 2014; Serna et al., 2015; entre otros) las metodologías automatizadas de evaluación de experiencia de visita a destinos turísticos actuales aún no permiten formular inferencias estadísticas; su incipiente nivel de desarrollo, experimental y exploratorio, no se considera suficientemente evolucionado para aportar recomendaciones o soluciones a empresarios o encargados de la gestión de destinos turísticos, por el momento.

REFERENCIAS BIBLIOGRÁFICAS

1. Amaya, C. (2012) "El proceso de lealtad del consumidor hacia los destinos de sol y playa. Un análisis empírico de los turistas que visitan Lloret de Mar y Cancún." Tesis doctoral. Universidad de Girona, Girona        [ Links ]

2. Andrades-Caldito, L.; Sánchez-Rivero, M. & Pulido-Fernández, J. (2013) "Differentiating competitiveness through tourism image assessment: An application to Andalusia (Spain)". Journal of Travel Research 52(1): 68–81

3. Barros, C.; Botti, L.; Peypoch, N.; Robinot, E.; Solonandrasana, B. & George, A. (2011) "Performance of French destinations: Tourism attraction perspectives". Tourism Management 32(1): 141–146

4. Blanke, J. & Chiesa, T. (2013) "The travel & tourism competitiveness report 2013." World Economic Forum, Davos        [ Links ]

5. Caber, M.; Albayrak, T. & Matzler, K. (2012) "Classification of the destination attributes in the content of competitiveness (by revised importance-performance analysis)". Journal of Vacation Marketing 18(1): 43–56

6. Capone, F. (2006) "Systemic approaches for the analysis of tourism destinations: Towards the tourist local systems". En: Lazzeretti, L. & Petrillo, C. (Eds.) Tourism local systems and networking. Elsevier, Amsterdam, pp. 7-24         [ Links ]

7. Chen, C. & Phou, S. (2013) "A closer look at destination: Image, personality, relationship and loyalty". Tourism Management 36: 269-278        [ Links ]

8. Claver-Cortés, E.; Molina-Azorín, J. & Pereira-Moliner, J. (2007) "Competitiveness in mass tourism". Annals of Tourism Research 34(3): 727–745

9. Cracolici, M. & Nijkamp, P. (2008) "The attractiveness and competitiveness of tourist destinations: A study of Southern Italian regions". Tourism Management 30(3): 336 – 344

10. Crouch, G. (2000) "Services research in destination marketing." International Journal of Hospitality & Tourism Administration 1(2): 65 - 86        [ Links ]

11. Davenport, T. (2013) "At the Big Data Crossroads: turning towards a smarter travel experience. Amadeus IT Group". Disponible en http://blogamadeus.com/wp-content/uploads/Amadeus-Big-Data-Report.pdf Acceso el 30 de abril de 2015        [ Links ]

12. Dickinger, A.; Költringer, C. & Körbitz, W. (2011, January) "Comparing online destination image with conventional image measurement–The case of Tallinn". En: Law, R.; Fuchs, M. & Ricci, F. (Eds.) Information and communication technology in Tourism. Springer, Vienna, pp. 165-178

13. Enright, M. & Newton, J. (2004) "Tourism destination competitiveness: A quantitative approach". Tourism Management 25(6): 777–788

14. Enright, M. & Newton, J. (2005) "Determinants of tourism destination competitiveness in Asia Pacific: Comprehensiveness and universality." Journal of Travel Research 43: 339-350        [ Links ]

15. Fan, W. & Bifet, A. (2013) "Mining big data: current status, and forecast to the future".ACM SIGKDD Explorations Newsletter 14(2): 1-5        [ Links ]

16. Fedele, S.; De Ascaniis, S. & Cantoni, L. (2011) "Destination marketing and users' appraisal: Looking for the reasons why tourists like a destination." En: Law, R.; Fuchs, M. & Ricci, F. (Eds.) Information and communication technology in Tourism. Springer, Vienna, pp. 151-163        [ Links ]

17. Feldman, R. (2013) "Techniques and applications for sentiment analysis". Communications of the ACM 56(4): 82–89

18. Fuchs, M.; Höpken, W. & Lexhagen, M. (2014) "Big data analytics for knowledge generation in tourism destinations–A case from Sweden". Journal of Destination Marketing & Management 3(4): 198-209

19. Gandomi, A. & Haider, M. (2015) "Beyond the hype: Big data concepts, methods, and analytics". International Journal of Information Management 35(2): 137-144        [ Links ]

20. Gartner (2015) "About Gartner". Disponible en http://www.gartner.com/technology/about.jsp. Acceso el 10 de julio de 2015        [ Links ]

21. Girardin, F.; Calabrese, F.; Fiore, F.; Ratti, C. & Blat, J. (2008) "Digital foot printing: Uncovering tourists with user-generated content". Pervasive Computing - IEEE 7(4): 36-43        [ Links ]

22. Gundecha, P. & Liu, H. (2012) "Mining social media: A brief introduction". Tutorials in Operations Research 1(4): 1-17        [ Links ]

23. Heerschap, N.; Ortega, S.; Priem, A. & Offermans, M. (2014, May) "Innovation of tourism statistics through the use of new big data sources". 12th Global Forum on Tourism Statistics, Prague        [ Links ]

24. He, W.; Zha, S. & Li, L. (2013) "Social media competitive analysis and text mining: A case study in the pizza industry". International Journal of Information Management 33(3): 464–472

25. Huang, J. & Peng, K. (2012) "Fuzzy rasch model in TOPSIS: A new approach for generating fuzzy numbers to assess the competitiveness of the tourism industries in Asian countries". Tourism Management 33: 456-465        [ Links ]

26. Jin, X.; Wah, B.; Cheng, X. & Wang, Y. (2015) "Significance and challenges of big data research". Big Data Research 2(2): 59-64        [ Links ]

27. Kotler, P.; Bowen, J. & Makens, J. (2003) "Marketing para turismo". Prentice Hall, Madrid        [ Links ]

28. Kim, P. (2006) "The forrester wave: Brand monitoring, Q3 2006," Forrester Wave (white paper). Disponible en http://ithelink.net/attachment/cfile24.uf@130FEB244A5C391964131D.pdf. Acceso el 12 de julio de 2015        [ Links ]

29. Lu, W. & Stepchenkova, S. (2014) "User-generated content as a research mode in tourism and hospitality applications: Topics, methods, and software". Journal of Hospitality Marketing & Management 24(2): 119-154        [ Links ]

30. Liu, B. (2012) "Sentiment analysis and opinion mining". Synthesis Lectures on Human Language Technologies 5(1): 1-167        [ Links ]

31. Loukides, M. (2011) "What Is Data Science?" Disponible en https://www.oreilly.com/ideas/what-is-data-science. Acceso el 12 de julio de 2015        [ Links ]

32. Marine-Roig, E. & Clave, S. (2015) "A method for analyzing large-scale UGC data for tourism: Application to the case of Catalonia". In: Tussyadiah, I. & Inversini, A. (Eds.) Information and communication technologies in tourism. Springer International Publishing, Berlin, pp. 3-17        [ Links ]

33. Molina-Azorin, J.; Pereira-Moliner, J. & Claver-Cortés, E. (2010) "The importance of the firm and destination effects to explain firm performance". Tourism Management 31: 22–28

34. Palakvangsa-Na-Ayudhya, S.; Sriarunrungreung, V.; Thongprasan, P. & Porcharoen, S. (2011, May) "Nebular: A sentiment classification system for the tourism business". Computer Science and Software Engineering (JCSSE) - Eighth International Joint Conference – IEEE, pp. 293-298

35. Pan, B.; MacLaurin, T. & Crotts, J. (2007) "Travel blogs and the implications for destination marketing". Journal of Travel Research 46(1): 35-45        [ Links ]

36. Pan, B.; Chenguang Wu, D. & Song, H. (2012) "Forecasting hotel room demand using search engine data". Journal of Hospitality and Tourism Technology 3(3): 196-210        [ Links ]

37. Pike, S. (2012) "Destination positioning opportunities using personal values: Elicited through the repertory test with laddering analysis". Tourism Management 33(1): 100-107        [ Links ]

38. Pizam, A. (2010) "Creating memorable experiences". International Journal of Hospitality Management 29(3): 343-357        [ Links ]

39. Reeve, A. (2013) "Managing data in motion: Data integration best practice techniques and technologies". Morgan Kaufmann, Massachusetts        [ Links ]

40. Ritchie, J. B. & Crouch, G. (2005) "The competitive destination: A sustainable tourism perspective". Cabi, Massachusetts        [ Links ]

41. RocaSalvatella & Telefónica (2014) "Big Data y turismo: nuevos indicadores para la gestión turística" Disponible en http://www.rocasalvatella.com/es/big-data-y-turismo-nuevos-indicadores-para-la-gestion-turistica. Acceso el 14 de mayo de 2015        [ Links ]

42. Rossetti, M.; Stella, F.; Cao, L. & Zanker, M. (2015) "Analyzing user reviews in tourism with topic models". In: Tussyadiah, I. & Inversini, A. (Eds.) Information and communication technologies in tourism. Springer International Publishing, Berlin, pp. 47-58        [ Links ]

43. Secretaría de Turismo (2015) "Compendio Estadístico del Sector Turismo de 2014. DATATUR, México". Disponible en http://www.datatur.beta.sectur.gob.mx/SitePages/CompendioEstadistico.aspx. Acceso el 25 de noviembre de 2015        [ Links ]

44. Serna, A.; Marchiori, E.; Gerrikagoitia, J. K.; Alzua-Sorzabal, A. & Cantoni, L. (2015) "An auto-coding process for testing the cognitive-affective and conative model of destination image". In: Tussyadiah, I. & Inversini, A. (Eds.) Information and communication technologies in tourism. Springer International Publishing, Berlin, pp. 111-123        [ Links ]

45. Solís, I. & Martínez, L. (2015) "Analysis of information sources". Proyecto Diseño, desarrollo e implementación de un sistema experto de evaluación de experiencias a destinos turísticos y promoción. Manuscrito no publicado. CIATEQ, Querétaro         [ Links ]

46. Stepchenkova, S.; Kirilenko, A. & Morrison, A. (2009) "Facilitating content analysis in tourism research". Journal of Travel Research 47(4): 454-469        [ Links ]

47. Tech America Foundation's Federal Big Data Commission (2012) "Demystifying big data: A practical guide to transforming the business of Government". Disponible en http://www.techamerica.org/Docs/fileManager.cfm?f=techamerica-bigdatareport-final.pdf. Acceso el abril de 2015        [ Links ]

48. TripAdvisor (2016) "About us". Disponible en https://www.tripadvisor.com/PressCenter-c6-About_Us.html. Acceso el 11 de junio de 2015        [ Links ]

49. Tung, V. & Ritchie, J. B. (2011) "Exploring the essence of memorable tourism experiences". Annals of Tourism Research 38(4): 1367-1386        [ Links ]

50. VirtualTourist (2016) "About VirtualTourist.com". Disponible en https://www.virtualtourist.com/press-center/about-us/. Acceso el 11 de junio de 2015        [ Links ]

51. Xiang, Z.; Schwartz, Z.; Gerdes, J. & Uysal, M. (2015) "What can big data and text analytics tell us about hotel guest experience and satisfaction?" International Journal of Hospitality Management 44: 120-130        [ Links ]

52. Xiang, Z. & Gretzel (2010) "Role of social media in online travel information search". Tourism Management31(2): 179-188        [ Links ]

Recibido el 17 de mayo de 2016
Reenviado el 15 de junio de 2016
Aceptado el 17 de junio de 2016

Arbitrado anónimamente

Creative Commons License Todo el contenido de esta revista, excepto dónde está identificado, está bajo una Licencia Creative Commons