Estándares Internacionales de Semántica de Datos: Un lenguaje común para CallTrust DataSpace

En la era de la economía digital, el dato se ha consolidado como el activo más valioso de las organizaciones. Sin embargo, poseer datos no es suficiente; el verdadero valor reside en la capacidad de compartirlos, entenderlos y procesarlos de manera conjunta. En el sector de las telecomunicaciones, donde el fraude y las llamadas no deseadas (spam, spoofing, robocalls) generan pérdidas millonarias y erosionan la confianza del usuario, la colaboración es la única salida eficaz.

Aquí es donde entra en juego CallTrust DataSpace, una iniciativa pionera que trae al sector de las telecomunicaciones las posibilidades de los espacios de datos europeos. Liderada por Quobis, busca crear un entorno colaborativo para operadores de telefonía y empresas, para prevenir comunicaciones no deseadas. Pero, ¿cómo logramos que diferentes operadores y empresas hablen el mismo «idioma»? La respuesta está en los estándares internacionales de semántica de datos.

¿Qué es la semántica de datos y por qué es vital en un Espacio de Datos?

La semántica de datos no se refiere simplemente al formato de un archivo (como un CSV o un JSON), sino al significado de la información que contiene. En un ecosistema distribuido como CallTrust, participan múltiples actores: grandes operadores de telefonía, empresas tecnológicas y administraciones públicas. Cada uno puede registrar la información de una llamada (CDRs – Call Detail Records) de forma distinta.

Sin estándares semánticos, por ejemplo el «número llamante» para una empresa podría ser el «ID de origen» para otra. Los estándares aseguran que, independientemente de quién genere el dato, el sistema receptor comprenda exactamente qué representa cada atributo, garantizando la interoperabilidad semántica.

Los pilares semánticos de CallTrust DataSpace

Para que CallTrust DataSpace sea una solución robusta y escalable, su arquitectura se alinea con los marcos de referencia más exigentes a nivel europeo, como el Blueprint 1.0 del Data Space Support Center (DSSC).

A continuación, detallamos los estándares y tecnologías que actúan como columna vertebral semántica del proyecto:

1. Modelos específicos del sector: ETSI y TM Forum

El sector de las telecomunicaciones cuenta con una larga tradición de estandarización. CallTrust adopta como referencia preferente el formato ETSI TS 122 115, diseñado específicamente para la interconexión y tarificación de servicios de voz.

Complementariamente, se integran principios del TM Forum y su modelo SID (Shared Information/Data Model). Estos marcos proporcionan un modelo de datos común que permite a los operadores compartir CDRs —que incluyen IPs de origen, troncales de voz y mensajes de error— de forma que los algoritmos de Machine Learning puedan detectar patrones anómalos en tiempo real sin ambigüedades.

2. Vocabularios de interoperabilidad: DCAT y DQV

Para facilitar que los datos sean fáciles de encontrar y reutilizar (principios FAIR), CallTrust utiliza estándares del W3C:

  • DCAT (Data Catalog Vocabulary): Permite describir los catálogos de datos de forma que sean descubribles por terceros en el ecosistema.
  • DQV (Data Quality Vocabulary): Fundamental en la lucha contra el fraude, ya que proporciona un marco para describir la calidad del dato. Esto permite al usuario decidir si la información recibida es lo suficientemente precisa para bloquear una llamada sospechosa.

3. Tecnologías de Grafo: RDF y OWL

Para representar relaciones complejas entre datos, el proyecto se apoya en RDF (Resource Description Framework) y OWL (Web Ontology Language). Estas tecnologías permiten crear ontologías que definen conceptos y relaciones dentro del dominio de las telecomunicaciones, facilitando que el sistema no solo «lea» datos, sino que «entienda» el contexto de una comunicación.

Herramientas para el Gobierno del Dato

La implementación técnica de estos estándares se materializa a través de herramientas de código abierto líderes en la industria que Quobis integra en la plataforma middleware:

  • Apache Atlas: Se utiliza como el componente neurálgico para la gestión de metadatos, permitiendo la catalogación y asegurando la trazabilidad y linaje de los datos (saber de dónde vienen y cómo se han transformado).
  • Glosario de Datos: Un servicio que permite la creación de vocabularios de negocio, facilitando que personal no técnico pueda consultar y entender los activos de datos disponibles.

El impacto: Soberanía y Confianza

La adopción de estos estándares no es un mero ejercicio técnico; es la base de la soberanía del dato. Al utilizar un lenguaje común y estructurado, los productores de datos (como los operadores) pueden definir políticas de uso precisas mediante lenguajes como ODRL.

Esto garantiza que la información se comparte de manera segura, manteniendo el control sobre quién accede a qué y para qué fin. Además, la alineación con marcos como Gaia-X asegura que CallTrust DataSpace no sea un silo aislado, sino que pueda interconectarse en el futuro con otros espacios de datos europeos.

Conclusión

En Quobis, entendemos que la lucha contra el fraude telefónico requiere una inteligencia colectiva que solo es posible mediante el intercambio de datos confiables. Los estándares internacionales de semántica de datos son los que hacen posible esta colaboración, permitiendo que CallTrust DataSpace detecte y evite llamadas no deseadas.

Al estandarizar el significado de la información, no solo protegemos a los usuarios y a las empresas de ataques de spoofing o robocalls, sino que estamos construyendo los cimientos de una economía del dato más justa, transparente y segura.


Te interesa saber cómo tu organización puede participar en el ecosistema CallTrust? Escríbenos a innovation@quobis.com o visita nuestra sección de proyectos para conocer más sobre cómo estamos liderando la transformación digital en el sector de las telecomunicaciones.

Publicaciones Similares