Quobis participa en el informe «Small Language Models (SLM)»
En la segunda mesa de la jornada “IA Segura y Eficiente: estrategias para introducir Inteligencia Artificial en la empresa”,, dedicada a los Small Language Models (SLM), se presentó el
nuevo informe de DigitalES —anexo a su Libro Blanco de IA Generativa—, en un panel moderado
por Jorge Martos (Indra Group), con las intervenciones de Borja Lizarraga (Accenture), Mafalda
Vizcaíno (Deloitte Legal), Victoria Gómez (IBM) y Javier Hernández (Overlap).
El informe de DigitalES analiza el papel emergente de los SLM como alternativa eficiente y
accesible a los grandes modelos de lenguaje (LLM).
En el debate coincidieron en señalar que no se trata de elegir entre SLM y grandes modelos, sino
de combinarlos, utilizando los SLM para tareas más especializadas, repetitivas y cercanas al
usuario, dentro de un enfoque de IA distribuida.
Asimismo, se subrayó que los SLM facilitan una mejor gobernanza del dato, mayor trazabilidad,
control de resultados y protección de la privacidad, al trabajar con conjuntos de datos más
acotados. La adopción de esta tecnología, señalaron, debe abordarse como una decisión de
negocio y cumplimiento normativo, priorizando la formación de personas y una gestión del
cambio adecuada, empezando por proyectos sencillos que puedan generar valor a corto plazo.
¿Qué oportunidades hemos identificado para el uso de Small Language Models (SLM) en el ámbito de las telecomunicaciones?
Los SLM pueden optimizar diversos procesos específicos en el ámbito de telecomunicaciones, como son el caso del análisis de llamadas, la personalización de servicios y la gestión de consultas y soporte técnico.
Análisis de datos de las redes de voz
Desde Quobis hemos puesto el acento en la monitorización y optimización de redes SIP, un ámbito en el que llevamos algún tiempo integrando soluciones comerciales u open source, así como investigando a través de diferentes proyectos de I+D.
Las comunicaciones de voz hablan SIP
Seguramente el término VoIP resulte familiar (Voice over Internet Protocol), al menos mucho más familiar que el da y estandarizada. Una información muy valiosa que se almacena (SIP logs o CDRs) para identificar eventos relevantes como intentos de acceso no permitidos; fraude telefónico; intentos de establecimiento de llamada frustrados; detección de robocalls o simplemente como referencia para la facturación de servicios de voz.
Además, cada sesión (una llamada, por ejemplo) da lugar al intercambio de multitud de mensajes SIP. A escala de un operador esto pueden dar lugar a Tb de información en muy poco tiempo:

En este ejemplo, de una simple llamada, se puede apreciar cómo cada línea da lugar a un mensaje SIP.
Es fácil imaginarse, el enorme volumen de mensajes que se pueden llegar a generar en una organización con varios miles de trabajadores, con llamadas ocurriendo en paralelo, y con la intervención de elementos de red como PBX (centralitas) o SBCs, que a su vez añaden más información a estos mensajes.
Si esta complejidad no resultase suficiente, hay que entender que, aunque SIP es un protocolo estándar y abierto, lo que significa que puede ser implementado en una amplia variedad de plataformas y dispositivos, las implementaciones son dispares (SIP over UDP, SIP over TCP, SIP over TLS) por lo que es preciso elementos intermedios que permitan interoperar entre dispositivos.
SLM para la comunicación entre la red de telecomunicaciones y su administrador
Los SLM están adquiriendo tracción en el ámbito de la traducción de idiomas, ya que hacen posible la traducción instantánea, ya sea de conversaciones o imágenes (p.e. carteles). Al manejar menos parámetros que un LLM, sus tiempos de respuesta son mucho más rápidos (algo crítico en contextos que requieren baja latencia como el de las comunicaciones en tiempo real), sus costes más bajos y su adaptación a dominios especializados ofrecen un mejor rendimiento.
Precisamente, cuando hablamos de comunicaciones hombre-máquina, el desarrollo de un SLM especialmente orientado a la interpretación del protocolo SIP, es un caso de uso que se adapta perfectamente a las características de un SML.
Entendiendo las características del protocolo SIP, podemos diseñar una serie de prompts, que pueden estar predefinidos en el sistema, agilizando al máximo las respuestas a consultas recurrentes.
| CARACTERÍSTICAS DEL PROTOCOLO SIP | PROMPTS DEFINIDOS PARA EL SML |
| Media Negotiation – SDP (Session Description Protocol) | ¿No hay dispositivos compatibles en la red? ¿Cuál es el códec más común en la red? ¿Solo hay usuarios de audio? |
| Security – SRTP (Secure Real-time Transport Protocol) and TLS (Transport Layer Security) | ¿Cuántos intentos no autorizados has detectado? ¿Hay medios sin cifrar? ¿No hay mensajes de señalización cifrados? |
| Presence | ¿Hay usuarios disponibles en la red? ¿Cuánto tiempo ha estado un usuario disponible en la red? ¿Cuál es el rango de horas disponible más frecuente para los usuarios? |
| Conferencing – multi-party audio, video, and screen sharing sessions | ¿Cuántas veces se comparte la pantalla? ¿Cuántos usuarios hay en la conferencia? |
Es en este punto en el que el desarrollo de una interfaz con la información en lenguaje natural puede resultar crítica para el administrador de la red, reduciendo la exigencia de experiencia previa en SIP.
Optimización de redes SIP y monitorización
El fin último de esta interfaz basada en un SLM es la optimización de la red. En este ámbito ya existen aplicaciones de tecnologías habilitadoras como el big data, la integración de otras fuentes de información mediante APIs, indicadores SNMP (Simple Network Monitoring Protocol), … que expanden aún más el potencial del uso de IA, tanto en la identificación de eventos relevantes como en la optimización de la red a partir de dicha información.
El principal beneficio de la adopción de un SML es que muchas de estas operaciones caían del lado de sistemas automatizados que no son 100% transparentes para el administrador, quien se ve obligado a recurrir al análisis de datos históricos, o al empleo de KPI´ s poco intuitivos como los definidos por el IETF (p.e. latencias en las respuestas de mensajes ISP), para obtener una imagen más precisa de lo sucedido, siendo esta actividad exigente en términos de tiempo y recursos de análisis.
Un SLM dedicado al protocolo SIP democratizaría el uso de los datos generados por la red, permitiendo un buen aprovechamiento de esta incluso por parte de perfiles técnicos más inexpertos. Además, permite relacionarse con la información en vivo, facilitando la intervención sobre sesiones en curso (por ejemplo, expulsar de la red a un “user agent” sospechoso de estar realizando llamadas fraudulentas).
SLM y privacidad
La posibilidad de desplegar estos modelos en infraestructuras tecnológicamente más accesibles y económicas, permiten mantener los datos a salvo en los servidores
del proveedor de servicio, evitando la circulación de información sensible a través de diferentes infraestructuras (como centros de datos especializados en el procesado de información).
