property='og:image'/> Leopoldo Martínez D.: Del Big Data al Big Insights - Caso de estudio: Turismo de Lujo y Sustentable (1/4)

lunes, 5 de marzo de 2018

Del Big Data al Big Insights - Caso de estudio: Turismo de Lujo y Sustentable (1/4)


(Ud. puede revisar este post en inglés)


1. Introducción


El rápido crecimiento del contenido generado por los usuarios en los sitios web de redes sociales (foros de discusión y comentarios, blogs, microblogs, entre otros) es una de las principales causas de la inmensa cantidad de datos de opinión almacenados en diferentes formatos digitales (texto, imágenes y videos).

Para las empresas estos datos son una rica fuente de información sobre el comportamiento de sus usuarios y consumidores, específicamente sobre quiénes son, qué hacen y por qué lo hacen. Esta información tratada adecuadamente se puede transformar en acciones orientadas a mejoras de productos, prestar mejor servicio, identificar nuevas oportunidades de negocios, entre otras actividades.

Para analizar esta información se requiere de tecnologías de vanguardia que permitan extraer significado y mayor entendimiento (llamado insights en inglés) sobre consumidores (ej. percepción sobre productos y marcas, experiencia del usuario), el personal (ej. oportunidades de mejoras) y el negocio (ej. nuevos mercados y alianzas).

Por otro lado, existe un inmenso potencial de utilizar este conjunto de tecnologías de análisis en diferentes tipos de negocios. Esto es especialmente cierto en el área de turismo de lujo y sustentable, debido a factores como:

  • Turistas cada vez más habituados a prestar atención a lo que se comenta en los medios sociales online sobre los servicios de turismo y esparcimiento.
  • Turistas con alto poder adquisitivo y preferencia por temas como protección al medio ambiente y promoción de actividades de responsabilidad social.

Estos factores y un mercado con altas perspectivas de crecimiento crean las condiciones para que se conformen comunidades virtuales de usuarios y consumidores, de las cuales será posible extraer significado y entendimiento que se podrá utilizar para desarrollar ofertas personalizadas que consoliden tendencias de consumo en un sector específico.

Es de mi interés mostrar en cuatro posts los insights obtenidos de un estudio que desarrollé a partir de los comentarios y opiniones que personas y organizaciones hicieron sobre el tema del turismo de lujo y sustentable en Twitter.

Para llevar a cabo este estudio utilicé herramientas informáticas de análisis de datos de medios sociales, tanto comerciales (IBM Watson, Google Cloud Platform y MeaningCloud), así como de código abierto (Gephi y SpagoBI).

En este sentido, los resultados que se mostrarán en cada post serán los siguientes:

  • Primer post: definición del espacio de búsqueda e identificación de comunidades virtuales mediante el análisis de redes sociales.
  • Segundo Postidentificación de canales de interconexión. influenciadores y brokers mediante el análisis de redes sociales.
  • Tercer post:  evaluación de los diferentes tópicos que se están hablando y su relación con marcas y organizaciones mediante el procesamiento natural del lenguaje.
  • Cuarto post: identificación del perfil sicológico y las preferencias de consumo de las comunidades virtuales mediante la herramienta Personality Insights de IBM.

A continuación, los resultados de la primera parte.

2. Escucha activa: identificando comunidades virtuales, influenciadores y brokers


2.1. Definición del espacio de búsqueda


Esta tarea consiste en identificar las palabras o términos clave que se utilizarán para extraer datos de Twitter. En este sentido, es necesario definir si se desea “escuchar” solo lo que se está hablando alrededor del tema, o si se desea “escuchar” como el tema se habla alrededor de una organización, producto o marca específica. Para este estudio, se presentarán resultados sobre lo que se está hablando alrededor del tema turismo de lujo y sustentable en idioma inglés.

Los datos que definen el espacio de búsqueda se encuentran en la Tabla 1.

Tabla 1. Espacio de búsqueda
De la extracción de datos se obtuvieron un total de 390617 registros distribuidos porcentualmente como se muestra en la Figura 1 de forma interactiva (flote el mouse sobre este y los otros gráficos):


Fig. 1. Resultados de la extracción de datos

Los resultados muestran que globalmente la tendencia es a hacer retweet (73.3%), más que a hacer reply (5.3%). Asimismo, esta tendencia se mantiene uniforme en el tiempo de observación, como se observa quincenalmente en la Figura 2.

Fig. 2. Tendencia quincenal de los datos extraídos

Otro dato relevante fue el total de cuentas de Twitter que conversaron o fueron mencionadas, cuyo resultado fue de 60877. 


2.2. Comunidades virtuales


Ante la inmensidad de datos que se pueden extraer de los comentarios y opiniones que se hacen en un medio social online como Twitter, es importante segmentar estos datos en grupos de cuentas que puedan ser categorizados por una a varias características que los describan, con el fin de identificar los focos de atención en los próximos análisis.

En este sentido, en el contexto de este estudio el concepto de comunidades virtuales se ajusta perfectamente a este requerimiento, ya que busca definir grupos en función de la intensidad de conversaciones que se llevan a cabo entre cuentas, asumiendo que esa intensidad es debido a intereses comunes que existen alrededor de algún tema.

Para el conjunto de datos identificados en la Tabla 1 se detectaron un total de 9179 comunidades, de las cuales las 23 más grandes agrupan el 50% de las cuentas. En la Figura 3 se muestra las comunidades virtuales detectadas (dimensionadas por la cantidad de cuentas que las componen) .

Fig. 3. Comunidades virtuales detectadas

Un primer foco de atención para los próximos posts puede representarlo las comunidades más grandes como lo son las primeras seis que agrupan el 26.8% de las cuentas.

Nos vemos en el post 2 donde identificaré los canales de interconexión que existen entre comunidades, así como los grandes influenciadores y brokers.

3. Conclusiones y recomendaciones


En esta primera parte se mostró las potencialidades del uso de tecnologías de punta para el análisis de datos de medios sociales online. Esta potencialidad se desplegó a través de la identificación de comportamientos grupales como son las comunidades virtuales, permitiendo identificar los primeros focos de interés.

Por otro lado, en el contexto del turismo de lujo y sustentable se encontró una fuerte tendencia a dar retweet más que a dar reply. Esta característica será importante cuando se tengan que definir estrategias de comunicación.

Finalmente, sería recomendable ampliar este primer estudio con el componente siguiente:

- Geolocalización: al conocer dónde se encuentran las personas, organizaciones o empresas dueñas de las cuentas, se podría proponer acciones que den valor comercial o no-comercial adaptadas a las preferencias locales de esas comunidades.

Leopoldo Martínez D.
(www.linkedin.com/winacore/in)

No hay comentarios.:

Publicar un comentario