jueves, 8 de marzo de 2018

From Big Data to Big Insights - Case study: Sustainable and Luxury Tourism (2/4)

4. Interconnection channels, influencers and brokers

4.1. Interconnection channels

As discussed in the first post, the accounts that belong to each community converse with a greater intensity than they have with other communities. However, it is also important to identify the communication capacity that exists between communities, since this will be the channel to establish strategies based on complementary interests, such as cross-selling, business-to-business (B2B), business-to-customer (B2C) and costumer-to-cutomer (C2C).

Figure 4 shows interactively the interaction capacity (sized according to the number of channel-accounts) among the six largest communities.

Fig. 4. Interconnection capacity between virtual communities

A priori, we observe the great communication capacity that exists between communities 1 and 2 (220 channels) and 1 and 3 (201 channels). Otherwise, the community 6 that only has 78 channels to communicate with the other five communities.

In order to take advantage of the communication capacity that exists between communities, it is necessary to know who they are in these communities, what they do and why they do it. The first question will be answered in the following analyzes, leaving the other answers for posts 3 and 4.

4.1.2. Influencers

The first version you have of an influencer in online social media is that of public persons with a large number of followers, which gives them a great ability to spread their messages, be a leader of opinion or reference on one or several topics. This version, although valid, may be somewhat limited when it comes to specific issues such as luxury and sustainable tourism.

Initially, on specific issues an influencer has to have a large number of connections with the accounts that make up the virtual community to which it belongs. Thus, these influencers can spread messages (ex. opinions about products, promotions), become a reference for the community (ex. opinion leader), among others. In the event that an influencer also has a large following, this could be used to expand the current community.

On this approach the great influencers identified in the communities 1, 2, 3, 4, 5 and 6 respectively are the accounts: @luxury__travel, @IMVoyager, @MrScottEddy, @UN, @UNWTO and @antoniocphoto.

An inspection of the profile of these accounts on Twitter is shown in Figure 5:

Fig. 5. Main influencers in each virtual community

The fact that four accounts have their focus on luxury tourism (@luxury__travel, @IMVoyager, @MrScottEddy, @antoniocphoto) is remarkable. In addition, only the @UNWTO account mentions the sustainability aspect and the @UN account does not have an explicit reference to tourism. Another relevant aspect is that the four people are dedicated to promoting this type of tourism through blogs and personal web pages. It is also observed that the accounts of organizations are related to the United Nations, which gives them a more institutional than commercial character.

The previous characteristics of the influencers give a first indication of what might be the common interests discussed in those communities. Certainly, you have to have more details to define a clearer profile of those interests. This task will be developed in the third post, through the study of the content of the messages.

4.1.3. Brokers

Another role that is important to highlight are the accounts that by their position in the network have the capacity to serve as a bridge between communities. This ability arises because those accounts are usually found in the "best" way to communicate different communities. These bridge-accounts (also called brokers) can control the flow of information, causing the message to flow between communities or interrupt communication. 

Likewise, brokers can be used to transmit innovation information, such as, for example, getting the standards or good practices of preserving the environment in the tourism sector from the virtual communities that generate them to the virtual communities of the commercial tourism sector. 

In this study it was found that the main brokers are: @luxury__travel, @MrScottEddy, @PassportsHeart, @TriplePundit, @soumna, @lonelyplanet, @petervonstamm, @fotoviajar, @GlobalGoalsUN, @earthXplorer and @QuintaRealVsa.

This list shows that the account @luxury__travel is both influential and bridge, which gives it a power of influence and integration in your community.

Next, Figure 6 (see link) shows in an interactive way the main influencers of each community (sized by their number of connections) and the main bridges between communities (sized by the percentage of information flow that they regulate between communities).

By double clicking on the @UNWTO influencers, its five brokers are highlighted, of which @TriplePundit and @GlobalGoalsUN remark in their profile on Twitter the topic of sustainability.

This far I present part of the results of the study I developed on luxury and sustainable tourism. This topic will continue with more details in posts 2 and 3.

5. Conclusions and recommendations

In this second part there was a greater understanding and meaning (insights) of the group (virtual communities) and individual (influencers and brokers) behaviors identified. 

These insights in the context of luxury and sustainable tourism were reflected with information about accounts whose capacities of communication, influence and information flow control can be converted into actions that generate commercial or non-commercial value. Some of these actions could be: identification of new markets through virtual communities and the establishment of alliances with influencers and brokers for the promotion and development of commercial activities or social responsibility. 

Posts 1 and 2 detailed part of the scope of social listening in social media through the social network analysis. It is a first approach that can be deepened both in group and individual behaviors in social networks. In this sense, as a first step I would recommend including the following component:

Influencer by closeness: as explained in point 4.1.2 an influencer has the ability to reach many other accounts, but does not imply that there is a guarantee that this will happen "quickly". In this sense, the proximity influencer does have this characteristic that is very important for a new type of social unit: digital tribes. In these groups their relationship in online social media arises from sharing personal experiences very particular, which in the world of luxury and sustainable tourism is related to exclusive interests such as the practice of extreme water sports, expeditions to ecosystems of limited accessibility, among others. Virtual access to these exclusive groups requires the identification of accounts "close" to them.

See you in posts 3 and 4.

Leopoldo Martínez D.

lunes, 5 de marzo de 2018

From Big Data to Big Insights - Case study: Sustainable and Luxury Tourism (1/4)

1. Introduction

The rapid growth of user generated content in the social media on the web (discussion and comment forums, blogs, microblogs, among others) is one of the main raison of the huge volume of opinion data recorded in different digital formats (texts, images and videos).

For companies this data provides a rich source of information about its users and consumers behavior, specially about who they are, what they do and why they do it. This information treated properly can be transformed in actions oriented to improve their quality of products, provide better service, identify new business opportunities, among other activities.

To analyze this information, cutting-edge technologies are required for extract meaning and understanding (insights) about consumers (ex. product and brand perception, user experience), staff (ex. improvement opportunities) and business (ex. new markets and alliances).

On the other hand, there is an immense potential to use this set of analysis technologies in different types of businesses. This is especially true in the area of luxury and sustainable tourism, due to factors such as:

  • Tourists increasingly used to pay attention to what is discussed in online social media about tourism and leisure services.
  • Tourists with high purchasing power and preference for topics such as protection of the environment and promotion of social responsibility activities.

These factors and a market with high growth projections create the conditions for the conformation of virtual communities of users and consumers, from which it will be possible to extract meaning and understanding that can be used to develop personalized offers that consolidate trends. of consumption in a specific sector.

It is in my interest to show in four posts the insights obtained from a study that I developed based on the comments that people and organizations made about the topic of luxury and sustainable tourism on Twitter.

To carry out this study I used computer tools to analyze social media data, both commercial (IBM Watson, Google Cloud Platform and MeaningCloud), as well as open source (Gephi and SpagoBI).

The results that will be shown in each post will be the following:

  • First post: definition of searching space and identification of virtual communities through social networks analysis.
  • Second post: identification of interconnection channels, influencers and brokers through social networks analysis.
  • Third post: evaluation of the different topics that are being discussed and their relationship with brands and organizations through natural language processing.
  • Fourth post: identification of the psychological profile and consumption preferences of the virtual communities detected through IBM Personality Insights tool.

Next, the results of the first part.

2. Social listening: identifying virtual communities, influencers and brokers

2.1. Defining the searching space

This task consists in defining the words or key terms that will be used to extract data from Twitter. In this sense, it is necessary to define if you want to "listen" only what is being discussed around the topic, or if you want to "listen" as the topic is discussed around a specific organization, product or brand. For this study, results will be presented on what is being discussed around the theme of luxury and sustainable tourism in English language.
The data that define the searching space can be found in Table 1.

Table 1. Searching space

From the data extraction a total of 390617 records were obtained distributed as shown in Figure 1 interactively (hove the mouse over this and the other graphics):

Fig. 1. Results of data extraction

The results show that globally the tendency is to retweet (73.3%), rather than to reply (5.3%). Also, this trend remains uniform in the observation time, as observed biweekly in Figure 2.

Fig. 2. Biweekly trend of the extracted data

Another relevant fact was the total of Twitter accounts that discussed or were mentioned, whose result was 60877.

2.2. Virtual communities

Given the immensity of data that can be extracted from the comments and opinions that are made in an online social media such as Twitter, it is vital to segment this data into groups of accounts that can be categorized by one or several characteristics that describe them.

In this sense, in the context of this study the concept of virtual communities fits perfectly with this requirement, since it seeks to define groups based on the intensity of conversations that take place between accounts, assuming that this intensity is due to common interests that exist around a topic.

For the set of data identified in Table 1, a total of 9179 communities were detected, of which the 23 largest have 50% of the accounts. Figure 3 shows the detected virtual communities (sized by the number of accounts that compose them).

Fig. 3. Virtual communities detected

A first analysis focus can be represented by the larger communities, such as the first six, which account for 26.8% of the accounts.

See you in post 2 where I will identify the interconnection channels that exist between communities, as well as the big influencers and brokers.

3. Conclusions and recommendations

In this first part, some of the potential of the use of state-of-the-art technologies for the analysis of online social media data was shown. This potential was deployed through the identification of group behaviors such as virtual communities, allowing the identification of the first focal points of interest.

On the other hand, in the context of luxury and sustainable tourism, there was a strong tendency to retweet rather than reply. This characteristic will be important when communication strategies have to be defined.

Finally, it would be advisable to extend this first study the following component:

- Geolocation: when knowing where the people, organizations or companies that own the accounts are, one could propose actions that give commercial or non-commercial value adapted to the local preferences of those communities.

Leopoldo Martínez D.

Del Big Data al Big Insights - Caso de estudio: Turismo de Lujo y Sustentable (2/4)

4. Canales de interconexión, Influenciadores y brokers

4.1. Canales de interconexión

Como se comentó en el primer post, las cuentas que pertenecen a cada comunidad conversan con una intensidad mayor que la que tienen con otras comunidades. No obstante, también es importante identificar la capacidad de comunicación que hay entre comunidades, ya que ese será el canal para establecer estrategias basadas en intereses complementarios, como serían las ventas cruzadas, business-to-business (B2B), business-to-customer (B2C) y costumer-to-cutomer (C2C).

En la Figura 4 se muestra en forma interactiva la capacidad de interacción (dimensionada en función del número de cuentas-canales) entre las seis comunidades más grandes.

Fig. 4. Capacidad de interconexión entre comunidades virtuales (1)

A priori, se observa la gran capacidad de comunicación que existe entre las comunidades 1 y 2 (220 canales) y 1 y 3 (201 canales). Caso contrario de la comunidad 6 que solo dispone de 78 canales para comunicarse con las otras cinco comunidades.

Para poder sacar provecho de la capacidad de comunicación que existe entre las comunidades es necesario saber quiénes están en estas comunidades, qué hacen y por qué lo hacen. La primera pregunta se responderá en los siguientes análisis, quedando las otras respuestas para los posts 3 y 4.

4.1.2. Influenciadores

La primera versión que se tiene de un infuenciador en medios sociales online es la de aquellas personas públicas con un gran número de seguidores, lo cual les da una gran capacidad de difundir sus mensajes, ser líder de opinión o referencia sobre uno o varios temas. Esta versión, aunque valida, puede ser algo limitada cuando se trata de temas específicos como lo es el turismo de lujo y sustentable.

Inicialmente, en temas específicos un influenciador tiene que tener gran cantidad de conexiones con las cuentas que componen la comunidad virtual a la cual pertenece. De esta forma, estos influenciadores podrán propagar mensajes (ej. opiniones sobre productos, promociones), convertirse en una referencia de la comunidad (ej. líder de opinión), entre otros. En el caso que un influenciador también tenga una gran cantidad de seguidores, esto se podría utilizar para expandir la comunidad actual.

Bajo este enfoque los grandes influenciadores identificados en las comunidades 1, 2, 3, 4, 5 y 6 respectivamente son las cuentas: @luxury__travel, @IMVoyager,  @MrScottEddy, @UN, @UNWTO y @antoniocphoto.

Una inspección del perfil de estas cuentas en Twitter se muestra en la Figura 5:

Fig. 5. Principales influenciadores en cada comunidad virtual

Se destaca el hecho que cuatro cuentas tienen su foco en el turismo de lujo (@luxury__travel, @IMVoyager, @MrScottEddy, @antoniocphoto), solo la cuenta @UNWTO menciona el aspecto de sustentabilidad y la cuenta de @UN no tiene una referencia explícita al tema de turismo. Otro aspecto relevante es que las cuatro personas se dedican a promocionar este tipo de turismo a través de blogs y páginas web personales. Asimismo, se observa que las cuentas de organizaciones se relacionan a las Naciones Unidas, lo cual les da un carácter más institucional que comercial.

Las características anteriores de los influenciadores dan un primer indicio de cuáles podrían ser los intereses comunes conversados en esas comunidades. Indudablemente, se tiene que tener más detalles para definir un perfil más claro de esos intereses. Esta tarea se desarrollará en el tercer post, mediante el estudio del contenido de los mensajes.

4.1.3. Brokers

Otro rol que es importante destacar son las cuentas que por su posición en la red tienen la capacidad de servir de puente entre comunidades. Esta capacidad surge porque esas cuentas se suelen encontrar en el “mejor” camino para comunicar distintas comunidades. Estas cuentas-puente (también llamadas brokers) pueden controlar el flujo de información, haciendo que el mensaje fluya entre las comunidades o interrumpir la comunicación. 

Asimismo, los brokers pueden servir para transmitir información de innovación como por ejemplo sería hacer llegar los estándares o buenas prácticas de preservación del medio ambiente en el sector turismo desde las comunidades virtuales que las generan hasta las comunidades virtuales del sector comercial de turismo.

En este estudio se encontró que los principales brokers son: @luxury__travel, @MrScottEddy, @PassportsHeart, @TriplePundit, @soumna, @lonelyplanet, @petervonstamm, @fotoviajar, @GlobalGoalsUN, @earthXplorer y @QuintaRealVsa.

En esta lista se observa que la cuenta @luxury__travel es tanto influenciador como puente, lo cual le da un poder de influencia e integración en su comunidad.

A continuación, en la Figura 6 (ver enlace) se muestra en forma interactiva los principales influenciadores de cada comunidad (dimensionados por su cantidad de conexiones) y los principales puentes entre comunidades (dimensionados por el porcentaje de flujo de información que regulan entre comunidades).

Al dar doble click en el influenciador @UNWTO se resaltan sus cinco brokers, de los cuales @TriplePundit y @GlobalGoalsUN destacan en su perfil en Twitter el tema de sustentabilidad.

Hasta aquí presento parte de los resultados del estudio que desarrollé sobre el turismo de lujo y sustentable. Este tema continuará con más detalles en los posts 2 y 3.

5. Conclusiones y recomendaciones

En esta segunda parte se obtuvo un mayor entendimiento y significado (insights) de los comportamientos grupales (comunidades virtuales) e individuales (influenciadores y brokers) identificados. 

Estos insights en el contexto del turismo de lujo y sustentable se reflejaron con información sobre cuentas cuyas capacidades de comunicacióninfluencia y control de flujo de información se pueden convertir en acciones que generen valor de tipo comercial o no comercial. Algunas de estas acciones pudiesen ser: identificación de nuevos mercados mediante las comunidades virtuales y el establecimiento de alianzas con influenciadores y brokers para la promoción y desarrollo de actividades comerciales o de responsabilidad social.

En los posts 1 y 2 se detalló parte del alcance de la escucha activa en medios sociales online mediante el análisis de redes sociales. Es un primer acercamiento que puede ser profundizado tanto en los comportamientos grupales como individuales en redes sociales. En este sentido, como primer paso recomendaría incluir el siguiente componente:

Influenciador por cercanía: como se explicó en el punto 4.1.2 un influenciador tiene la capacidad de llegar a muchas otras cuentas, pero no implica que haya garantía de que esto suceda “rápidamente”. En este sentido, el influenciador de cercanía si tiene esta característica que es muy importante para un nuevo tipo de unidad social: tribus virtuales. En estos grupos su relacionamiento en medios sociales online surge de compartir experiencias personales muy particulares, que en el mundo del turismo de lujo y sustentable se relaciona con intereses exclusivos como son la práctica de deportes acuáticos extremos, expediciones a ecosistemas de accesibilidad limitada, entre otros. El acceso virtual a estos grupos exclusivos requiere la identificación de cuentas “cercanas” a ellos.

Nos vemos en los posts 3 y 4.

Leopoldo Martínez D.

Del Big Data al Big Insights - Caso de estudio: Turismo de Lujo y Sustentable (1/4)

1. Introducción

El rápido crecimiento del contenido generado por los usuarios en los sitios web de redes sociales (foros de discusión y comentarios, blogs, microblogs, entre otros) es una de las principales causas de la inmensa cantidad de datos de opinión almacenados en diferentes formatos digitales (texto, imágenes y videos).

Para las empresas estos datos son una rica fuente de información sobre el comportamiento de sus usuarios y consumidores, específicamente sobre quiénes son, qué hacen y por qué lo hacen. Esta información tratada adecuadamente se puede transformar en acciones orientadas a mejoras de productos, prestar mejor servicio, identificar nuevas oportunidades de negocios, entre otras actividades.

Para analizar esta información se requiere de tecnologías de vanguardia que permitan extraer significado y mayor entendimiento (llamado insights en inglés) sobre consumidores (ej. percepción sobre productos y marcas, experiencia del usuario), el personal (ej. oportunidades de mejoras) y el negocio (ej. nuevos mercados y alianzas).

Por otro lado, existe un inmenso potencial de utilizar este conjunto de tecnologías de análisis en diferentes tipos de negocios. Esto es especialmente cierto en el área de turismo de lujo y sustentable, debido a factores como:

  • Turistas cada vez más habituados a prestar atención a lo que se comenta en los medios sociales online sobre los servicios de turismo y esparcimiento.
  • Turistas con alto poder adquisitivo y preferencia por temas como protección al medio ambiente y promoción de actividades de responsabilidad social.

Estos factores y un mercado con altas perspectivas de crecimiento crean las condiciones para que se conformen comunidades virtuales de usuarios y consumidores, de las cuales será posible extraer significado y entendimiento que se podrá utilizar para desarrollar ofertas personalizadas que consoliden tendencias de consumo en un sector específico.

Es de mi interés mostrar en cuatro posts los insights obtenidos de un estudio que desarrollé a partir de los comentarios y opiniones que personas y organizaciones hicieron sobre el tema del turismo de lujo y sustentable en Twitter.

Para llevar a cabo este estudio utilicé herramientas informáticas de análisis de datos de medios sociales, tanto comerciales (IBM Watson, Google Cloud Platform y MeaningCloud), así como de código abierto (Gephi y SpagoBI).

En este sentido, los resultados que se mostrarán en cada post serán los siguientes:

  • Primer post: definición del espacio de búsqueda e identificación de comunidades virtuales mediante el análisis de redes sociales.
  • Segundo Postidentificación de canales de interconexión. influenciadores y brokers mediante el análisis de redes sociales.
  • Tercer post:  evaluación de los diferentes tópicos que se están hablando y su relación con marcas y organizaciones mediante el procesamiento natural del lenguaje.
  • Cuarto post: identificación del perfil sicológico y las preferencias de consumo de las comunidades virtuales mediante la herramienta Personality Insights de IBM.

A continuación, los resultados de la primera parte.

2. Escucha activa: identificando comunidades virtuales, influenciadores y brokers

2.1. Definición del espacio de búsqueda

Esta tarea consiste en identificar las palabras o términos clave que se utilizarán para extraer datos de Twitter. En este sentido, es necesario definir si se desea “escuchar” solo lo que se está hablando alrededor del tema, o si se desea “escuchar” como el tema se habla alrededor de una organización, producto o marca específica. Para este estudio, se presentarán resultados sobre lo que se está hablando alrededor del tema turismo de lujo y sustentable en idioma inglés.

Los datos que definen el espacio de búsqueda se encuentran en la Tabla 1.

Tabla 1. Espacio de búsqueda
De la extracción de datos se obtuvieron un total de 390617 registros distribuidos porcentualmente como se muestra en la Figura 1 de forma interactiva (flote el mouse sobre este y los otros gráficos):

Fig. 1. Resultados de la extracción de datos

Los resultados muestran que globalmente la tendencia es a hacer retweet (73.3%), más que a hacer reply (5.3%). Asimismo, esta tendencia se mantiene uniforme en el tiempo de observación, como se observa quincenalmente en la Figura 2.

Fig. 2. Tendencia quincenal de los datos extraídos

Otro dato relevante fue el total de cuentas de Twitter que conversaron o fueron mencionadas, cuyo resultado fue de 60877. 

2.2. Comunidades virtuales

Ante la inmensidad de datos que se pueden extraer de los comentarios y opiniones que se hacen en un medio social online como Twitter, es importante segmentar estos datos en grupos de cuentas que puedan ser categorizados por una a varias características que los describan, con el fin de identificar los focos de atención en los próximos análisis.

En este sentido, en el contexto de este estudio el concepto de comunidades virtuales se ajusta perfectamente a este requerimiento, ya que busca definir grupos en función de la intensidad de conversaciones que se llevan a cabo entre cuentas, asumiendo que esa intensidad es debido a intereses comunes que existen alrededor de algún tema.

Para el conjunto de datos identificados en la Tabla 1 se detectaron un total de 9179 comunidades, de las cuales las 23 más grandes agrupan el 50% de las cuentas. En la Figura 3 se muestra las comunidades virtuales detectadas (dimensionadas por la cantidad de cuentas que las componen) .

Fig. 3. Comunidades virtuales detectadas

Un primer foco de atención para los próximos posts puede representarlo las comunidades más grandes como lo son las primeras seis que agrupan el 26.8% de las cuentas.

Nos vemos en el post 2 donde identificaré los canales de interconexión que existen entre comunidades, así como los grandes influenciadores y brokers.

3. Conclusiones y recomendaciones

En esta primera parte se mostró las potencialidades del uso de tecnologías de punta para el análisis de datos de medios sociales online. Esta potencialidad se desplegó a través de la identificación de comportamientos grupales como son las comunidades virtuales, permitiendo identificar los primeros focos de interés.

Por otro lado, en el contexto del turismo de lujo y sustentable se encontró una fuerte tendencia a dar retweet más que a dar reply. Esta característica será importante cuando se tengan que definir estrategias de comunicación.

Finalmente, sería recomendable ampliar este primer estudio con el componente siguiente:

- Geolocalización: al conocer dónde se encuentran las personas, organizaciones o empresas dueñas de las cuentas, se podría proponer acciones que den valor comercial o no-comercial adaptadas a las preferencias locales de esas comunidades.

Leopoldo Martínez D.