El camino hacia una inteligencia artificial generativa multimodal

PROYECCIONES. La consultora Gartner cree que las soluciones de IA generativa multimodal pasarán de representar un 1 % en 2023 a un 40 % en 2027.

Las soluciones de inteligencia artificial (IA) generativa serán cada vez más multimodales. Si en 2023 representaban un 1 %, para 2027 alcanzarán un 40 % del total de las soluciones de IA.

Ese es el pronóstico que maneja la consultora Gartner, que espera que esta tecnología, que combina texto, imagen, audio y vídeo, tenga un impacto transformador sobre las aplicaciones empresariales.

Además, considera que la IA generativa multimodal mejorará la interacción con las personas y ofrecerá una oportunidad de diferenciación, con la incorporación de funcionalidades que de otro modo sería imposible.

“En el mundo real, las personas encuentran y comprenden la información a través de una combinación de diferentes modalidades, como audio, visual y sensorial”, comenta Erick Brethenoux, vicepresidente de Gartner.

“La inteligencia artificial generativa multimodal es importante porque los datos son típicamente multimodales”, señaló.

“Cuando se combinan o ensamblan modelos de una sola modalidad para respaldar aplicaciones de IA generativa multimodales, a menudo se produce latencia y resultados menos precisos, lo que se traduce en una experiencia de menor calidad”, explicó.

Escalabilidad

“A medida que el mercado de IA generativa evoluciona hacia modelos entrenados de forma nativa en más de una modalidad”, desarrolló Brethenoux, “esto ayuda a capturar relaciones entre diferentes flujos de datos y tiene el potencial de escalar los beneficios de la IA generativa en todo tipo de datos y aplicaciones”.

Gartner cree que la IA multimodal, al igual que los grandes modelos de lenguaje de código abierto, dejará notar sus efectos en las compañías durante los próximos años.

Además, “aumenta el potencial de innovación a través de la personalización, un mejor control de la privacidad y la seguridad, la transparencia del modelo, la capacidad de aprovechar el desarrollo colaborativo y el potencial de reducir la dependencia de un proveedor”, afirmó Arun Chandrasekan, analista de Gartner.

Dos caminos

En ese sentido, la consultora identifica dos tecnologías que ofrecen el mayor potencial para este desarrollo: modelos GenAI específicos del dominio y agentes autónomos.

“Los primeros pueden lograr tiempos de generación de valor más rápidos, un mejor rendimiento y una mayor seguridad para los proyectos de IA al proporcionar un punto de partida más avanzado para las tareas específicas de la industria”, afirmó Chandrasekaran.

Agregó que “esto fomentará una adopción más amplia de GenAI porque las organizaciones podrán aplicarlos a casos de uso en los que los modelos de propósito general no son lo suficientemente eficientes”.

Los agentes autónomos son sistemas combinados que logran objetivos definidos sin intervención humana. Utilizan una variedad de técnicas de IA para identificar patrones en su entorno, tomar decisiones, invocar una secuencia de acciones y generar resultados. Estos agentes tienen el potencial de aprender de su entorno y mejorar con el tiempo, lo que les permite manejar tareas complejas.

Fuente: Gartner, Inc.