
Imagina a una inteligencia artificial (IA) como un superhéroe con gafas de realidad aumentada, capaz de captar información de todo lo que ve, escucha, y lee.
Este campeón de la multitarea no solo lee tus textos o escucha tus audios, sino que también se traga imágenes y videos como si fueran palomitas de maíz. Y gracias a esta dieta variada, entiende el mundo con una perspectiva más amplia.
Por poner un ejemplo de película: si le muestras una foto de tu perro disfrazado de superhéroe y le cuentas lo que estás viendo, la IA no solo captará la épica del momento, sino que además podrá continuar la conversación añadiendo su propio toque de humor o información relevante, como si realmente entendiera la personalidad de tu perro.
¿ Y quienes tienen inteligencia artificial Multimodal?
En el mundo de la tecnología, tenemos a las grandes ligas jugando con esta magia.
OpenAI, por ejemplo, es como el Dumbledore de la IA, creando cosas asombrosas como GPT (un charlatán virtual) y DALL·E (un Picasso digital).
Luego está Google, que es básicamente el Sherlock Holmes de Internet, siempre un paso adelante, entendiendo tanto lo que escribes como lo que muestras en imágenes.
Microsoft, por su parte, está construyendo su propio Batimóvil con Azure AI, dándole a los desarrolladores las herramientas para crear sus propios superhéroes de IA.
IBM está en plan Doctor Who con Watson, viajando por el universo del conocimiento en su cabina telefónica tecnológica.
Y no olvidemos a Facebook (ahora Meta), que está como Tony Stark en su laboratorio, experimentando con formas de hacer que sus redes sociales sean aún más adictivas con la IA.
Estas compañías están en la delantera de esta carrera superheroica, buscando maneras de hacer que las máquinas no solo entiendan el mundo como nosotros, sino que también participen en nuestras conversaciones, aportando algo más que simples respuestas automáticas. Es como estar en una película de ciencia ficción, pero sin tener que salir de casa.