ImageBind: la nueva inteligencia artificial que promete pensar con sentidos humanos - RED/ACCIÓN

ImageBind: la nueva inteligencia artificial que promete pensar con sentidos humanos

 Una iniciativa de Dircoms + RED/ACCION

Meta lanzó una IA que además de relacionar imágenes, audios y videos, suma datos de profundidad, temperatura y movimiento. La herramienta se presenta como un “entendimiento holístico“ y un nuevo acercamiento a las capacidades humanas.

ImageBind: la nueva inteligencia artificial que promete pensar con sentidos humanos

Foto: Facebook Mark Zuckerberg.

La empresa que dirige Mark Zuckerberg presentó ImageBind, una nueva herramienta de inteligencia artificial que es capaz de trabajar con distintos datos sensoriales. La tecnología logra relacionar seis fuentes de datos diferentes: imágenes y video, audio, texto, profundidad, temperatura y movimiento. Es de código abierto y está disponible para investigadores.
En su comunicado, Meta describió a ImageBind como un “entendimiento holístico“ que se acerca aún más a las capacidades humanas. La herramienta podría unir distintos datos sensoriales como, por ejemplo, conectar los objetos de una fotografía con sonidos, formas en tres dimensiones o movimientos. También sería capaz de crear imágenes a partir de ruidos.

A futuro, la empresa sugiere que ImageBind podría introducir nuevas fuentes de datos sensoriales como el tacto y el olor, e incluso imágenes por resonancia magnética cerebrales. El propósito de Meta es seguir avanzando en la investigación para “diseñar mundos inmersivos y virtuales“, es decir, el famoso metaverso.

Meta, la empresa dueña de Whatsapp, Facebook e Instagram, ya presentó también otra herramienta de IA para investigadores titulada LLaMa (Large Language Mode Meta AI), pero hasta el momento no ha lanzado aplicaciones con potencial comercial. Sus rivales tecnológicas, ChatGPT y OpenAI, mantienen la delantera en este sentido con sus chatbots.

“Cuando los humanos absorbemos información del mundo, usamos múltiples sentidos de manera innata, como ver una calle concurrida y escuchar los sonidos de los motores de los automóviles. Hoy presentamos un enfoque que lleva a las máquinas un paso más cerca de la capacidad de los humanos para aprender de forma simultánea, holística y directa de muchas formas diferentes de información”, explicó Meta en su comunicado. 

Mark Zuckerberg, CEO de la compañía, publicó en su Facebook un video que explica cómo funciona la tecnología, y escribió: “Hoy abrimos ImageBind, un nuevo modelo de IA que combina diferentes sentidos como lo hace la gente. Entiende imágenes, vídeo, audio, profundidad, movimiento térmico y espacial. Estoy deseando ver lo que todos construyen con él”.