Glosario básico para no perderse entre datos: 2ª parte, de la “G” a la “Z”
Glosario - 2ª parte: de la "G" a la "Z"
Este post y su primera parte pretenden ser de ayuda para entender algunos de los términos técnicos más comunes que aparecen con frecuencia en el entorno de la ciencia del dato.
Términos incluidos en esta 2ª parte: gemelos digitales; GIS (Sistema de información geográfica); gobernanza de los datos; horizontalidad de los datos; Insights; inteligencia artificial; interoperabilidad; IoT; KPIs; metaverso; modelo de datos; NFC; normas UNE; Sandbox; soberanía de los datos; SQL y query; y token.
GEMELO DIGITAL: es una réplica digital exacta de algo del mundo real y puede ser de prácticamente cualquier cosa: un objeto, un proceso o un espacio, por ejemplo. A diferencia de otras representaciones virtuales, se caracteriza por recrear también su funcionamiento en tiempo real gracias al procesamiento de los datos que recibe de su original mediante sensores inteligentes. A medida que procesa más datos, es capaz de predecir y reproducir situaciones mediante técnicas de simulación y de aprendizaje automático. Su aplicación supone un enorme reto de digitalización de procesos y de gestión de datos. Por ejemplo, si se quisiese aplicar en una atracción turística, habría que instalar sensores para obtener información en tiempo real de las variables a tener en cuenta y disponer de capacidad para gestionar toda la información.
GIS (SISTEMA DE INFORMACIÓN GEOGRÁFICA): es la integración de distintas variables con datos geoespaciales en un mismo mapa o escenario tridimensional para facilitar la interpretación de sus relaciones y la posible identificación de patrones o tendencias. Ésta se hace con el uso de distintas capas de información, su combinación y el empleo de filtros. Puede conocer cómo funcionan en el post “Datos geospaciales: mapas que ayudan a interpretar los datos”.
GOBERNANZA DE LOS DATOS: son el conjunto de normas con las que se gestionan los datos desde su adquisición, durante su uso y gestión y hasta su eliminación. El gobierno de los datos implica establecer estándares para regular todo su ciclo de vida, identificar quiénes pueden acceder a cada dato y quiénes son responsables de su precisión y confiabilidad. Su objetivo final es asegurar la calidad de los datos haciendo que sean más confiables, que se cumplan las normas regulatorias, legales e industriales y garantizando una única versión de los datos. En este sentido, la Unión Europea aprobó en 2022 la “Ley de Gobernanza de Datos”, que fomentará la reutilización más extensa de los datos protegidos del sector público.
HORIZONTALIDAD DE LOS DATOS: es la capacidad de los datos para ser de igual interés a numerosos actores de sectores diversos. Se entiende desde el punto de vista de que el dato se considera un recurso no rival y su uso y compartición contribuyen a aumentar la capilaridad del negocio. Un dato puede ser de interés para varias empresas del mismo sector, pero también para las de ramas relacionadas y otras que pueden desarrollar líneas de negocio sin relación inicial aparente. Por ejemplo, los datos de reservas de vuelos en origen son importantes para los hoteles del destino, pero también para toda su industria terciaria, para las fuerzas de seguridad o para la administración local.
INSIGHTS: la definición de esta palabra inglesa apunta a “un conocimiento profundo”. En materia de datos, se trata de la inteligencia generada a partir de los datos y que ayuda a comprender qué ocurre. En cierto modo, podrían definirse como las palancas o claves que provocan acciones o toma de decisiones basadas en datos.
Los insights no son datos en bruto. Tampoco son las visualizaciones de éstos en cuadros de mando. El insight requiere el análisis y muchas veces puede reflejarse en un cuadro de mandos a través de la combinación de indicadores clave (datos o métricas individuales). La relación entre estos indicadores dará lugar al insight. Por ejemplo, si tenemos datos de visitas a un monumento, información del tiempo medio de espera para entrar en él, conocimiento del grado de satisfacción de la visita y se hace escucha activa en redes sociales, un análisis de los datos podría confirmar que a partir de un tiempo de espera, las visitas se estancan, el grado de satisfacción cae en picado y aparecen publicaciones negativas en redes sociales. De este modo, el tiempo de espera y el grado de satisfacción serían indicadores clave y la relación entre estos datos y su efecto sería un insight que nos llevará a tomar decisiones como instaurar un sistema de reservas, lanzar una estrategia de choque en redes sociales, proponer visitas o actividades alternativas a partir de un tiempo de espera o amenizar la misma para disminuir la sensación negativa del turista.
INTELIGENCIA ARTIFICIAL: es la habilidad de una máquina para imitar el funcionamiento de la mente humana con acciones como el razonamiento, el aprendizaje, la creatividad o la planificación. Sus desarrollos más evolucionados se basan en el procesamiento masivo de información y la aplicación de algoritmos de cálculo para automatizar la toma de decisiones. Es el llamado aprendizaje automático o Machine Learning. Como ocurre con la mente humana, a mayor práctica y estudio (más cantidad de datos procesados), más aprende el sistema y sus cálculos serán más eficaces para la toma de decisiones, resolución de problemas o predicción de comportamientos. Muchas veces se hace referencia a la inteligencia artificial con sus siglas, bien en castellano (IA) o en inglés (AI – Artificial Intelligence)
INTEROPERABILIDAD: es la capacidad de distintos sistemas de información de intercambiar información y conocimiento entre ellos. En líneas generales, se trata de que los sistemas hablen el mismo idioma y se aplica desde al tratamiento de los datos hasta a su gestión, su almacenamiento y su intercambio. En lo referido al tratamiento del dato y su gestión, la homogenización o estandarización en el vocabulario, en las estructuras y en sus características son clave. Mientras, la tecnología es fundamental en el almacenamiento y el intercambio. Puede limitarse al empleo de tipos de archivos de uso generalizado (el formato csv es el más extendido). Sin embargo, para el intercambio efectivo de grandes cantidades de información, podría incluir el empleo de conectores de los distintos softwares a través de API, el desarrollo de un conector común que funcione a modo de hub o la creación de un espacio de datos en el que los intercambios se hacen mediante el acceso directo de todos los miembros a la información.
IoT o INTERNET DE LAS COSAS: se conoce así a la conexión de los objetos físicos a Internet para la transmisión e intercambio de datos. Suele hacerse a través de sensores y chips informáticos con tecnologías de comunicación inalámbrica como Bluetooth o NFC (Near-Field Communication o comunicación en campo cercano). Permite la comunicación entre objetos y la transmisión de información a un servidor o a la nube para su procesamiento y posible análisis. Comúnmente, se dice que esta conexión a la Red transforma cualquier objeto en inteligente porque puede actuar en función de los datos que recoge y transmite. Es la base de las ciudades inteligentes o Smart Cities. En turismo, es muy práctico para monitorizar flujos, personalizar ofertas o servicios.
KPIs: se refiere a los Indicadores Clave de Rendimiento y son sus siglas en inglés (Key Performance Indicators). Son los datos que deben monitorizarse en un cuadro de mando y cuyos valores muestran la salud de lo que se estudia. Por ejemplo, el número de visitas a un monumento y el grado de satisfacción del turista pueden ser KPIs. La relación entre el número de visitas y el grado de satisfacción o el tiempo de espera sería un insight.
MACHINE LEARNING o APRENDIZAJE AUTOMÁTICO: puede consultarlo en la primera parte del glosario.
METAVERSO: sería un ecosistema virtual y tridimensional orientado a la interacción humana mediante un avatar. A diferencia de los gemelos digitales, el metaverso no reproduce el funcionamiento en tiempo real porque no procesa datos y se basa en la integración del mundo real y el virtual de un modo simbólico. Por ejemplo, puede reproducirse la idea de una oficina de turismo, pero no se replica necesariamente la oficina de turismo real. O la presencia del destino puede limitarse a sus principales atractivos turísticos y no reproducir toda la ciudad.
MINERÍA DE DATOS o DATA MINING: puede consultarlo en la primera parte del glosario.
MODELO DE DATOS: es la representación de los elementos de un conjunto de datos y de sus relaciones y conexiones entre sí, habitualmente a través de diagramas de flujos. Si se habla de modelos de datos inteligentes, éstos deben asegurar la compatibilidad e interoperabilidad de los datos al tiempo que suprime redundancias, facilita la recuperación y reduce las necesidades de almacenamiento. El modelo de datos, por tanto, recoge desde la estructura homogenizada de los datos para hacerlos compatibles e interoperables entre sistemas hasta el detalle de los datos que aparecen, las convenciones semánticas y de normalización aplicadas, la identificación de atributos, de las entidades intervinientes y de las relaciones entre los datos.
NFC: es una tecnología de comunicación inalámbrica de corto alcance que permite el intercambio de datos entre dispositivos cercanos (deben situarse a una distancia máxima de alrededor de 10 centímetros). Quizá su uso más extendido es el de su aplicación en el pago con el móvil y validación de identidades.
NORMAS UNE: las normas UNE son especificaciones técnicas aprobadas por la Asociación Española de Normalización y Certificación (AENOR) para ayudar a las empresas y agentes de cada sector a aumentar los niveles de calidad y seguridad y a posicionarse en el mercado. Se basan en la experiencia y en el desarrollo tecnológico y en su formulación participan todas las partes interesadas. Aunque son de aplicación voluntaria, su seguimiento es una buena práctica para la normalización necesaria para trabajar con datos.
SOBERANÍA DE LOS DATOS: se puede entender como el aspecto legal de la gobernanza de los datos y se refiere a las normas o legislación para la protección de los datos en todo su ciclo de vida y a la regulación de la posesión de los datos por parte de empresas y gobiernos. En este sentido, la Ley Orgánica de Protección de Datos, en España, y el RGPD (Reglamento General de Protección de Datos) y la Ley de Ciberseguridad, a nivel europeo, son clave en la soberanía de los datos. Esta legislación responde a preguntas como quién es el propietario de los datos, quién puede almacenarlos, cómo pueden usarse, cómo deben protegerse y cuáles son las consecuencias de su mal uso. Junto a la infraestructura informática, la soberanía de los datos es la herramienta fundamental para garantizar la seguridad de los datos.
QUERY y SQL: la primera es una consulta para obtener información de una base de datos o sistema de información. La segunda es el lenguaje de programación más extendido para el manejo de base de datos y la descarga de sus datos. Su nombre proviene de las siglas de Structured Query Language o lenguaje de consulta estructurado. Su uso permite automatizar numerosos procesos de acceso y manipulación de la información almacenada en bases de datos. SQL hace referencia al lenguaje de forma genérica, pero cada desarrollador suele ofrecer su propia versión del software, aunque siempre de funcionamiento muy parecido.
SANDBOX: en informática, el término caja de arena (traducción al castellano) se refiere a un entorno aislado de pruebas en el que se testean desarrollos antes de su integración en un sistema. En Big Data, estos entornos aislados se emplean como espacios para la exploración colaborativa de datos y son plataformas con gran capacidad de gestión y procesamiento de datos que se emplean para la experimentación con grandes volúmenes de datos.
TOKEN: es una representación digital de un valor emitida por una entidad privada bajo tecnología blockchain. El valor que representa queda definido por su emisor pero sólo será real en el entorno para el que ha sido creado. Es decir, aunque represente un valor económico, no tendrá curso legal ni tiene en la economía real el valor económico que representa. Sus desarrollos van desde representar el derecho a una prestación de servicios (Utility Token), funcionar de forma similar a valores financieros (Security Token) o a acciones del mercado de valores (Equity Token) a ser elementos únicos y coleccionables (NFT). Estos últimos están potenciando la inversión en tókenes que representan obras de arte o elementos coleccionables y el consecuente desarrollo de un arte digital ligado a los tókenes.
- Si quiere consultar el resto de términos de este glosario básico, puede leer la primera parte del post. Se incluyen las siguientes definiciones:
Anonimización de los datos; API; aprendizaje automático; aprendizaje profundo; beacons; Big Data; Blockchain; Business Intelligence; csv; casos de uso; Data Lake; datos federados; Data Mining; diccionario de datos; espacio de datos; fuga de datos.