El surgimiento de una nueva forma de inteligencia artificial: Aprendizaje e Imaginación al estilo humano

por | Jun 28, 2023 | Inteligencia Artificial

Científicos revolucionan la inteligencia artificial con un nuevo modelo generativo que crea imágenes a partir de texto, utilizando los mecanismos de la mente humana

La compañía Meta, liderada por Mark Zuckerberg y responsable de Facebook e Instagram, revela un innovador modelo de inteligencia artificial llamado I-JEPA (Arquitectura predictiva de incrustación conjunta de imágenes), que imita la forma en que los humanos razonamos y promete generar imágenes de mayor realismo. Este avance supone un cambio significativo en el análisis y creación de imágenes. Meta ha anunciado su intención de proporcionar acceso a los componentes de I-JEPA a los investigadores para fomentar el desarrollo de nuevos productos basados en esta tecnología.

Se logra un importante avance: la creación de una inteligencia artificial con sentido común

El modelo de inteligencia artificial I-JEPA se fundamenta en las ideas del destacado investigador Yann LeCun, quien es el responsable de IA en Meta y considerado uno de los pioneros en el campo de la inteligencia artificial. LeCun aboga por acercar la IA a la forma en que los seres humanos piensan, lo cual implica enseñar a la IA el sentido común y proporcionarle modelos de cómo funciona el mundo.

LeCun sostiene que tanto los seres humanos como los animales no humanos tienen la capacidad de adquirir una gran cantidad de conocimiento previo sobre cómo funciona el mundo mediante la observación y con solo un número limitado de interacciones, sin importar la tarea específica y sin la necesidad de supervisión. Según él, este conocimiento acumulado podría considerarse como la base del sentido común.

Los investigadores de Meta comparten la idea de que el sentido común puede ser visto como una colección de modelos del mundo que nos guían en la comprensión de lo que es probable, plausible e imposible. Estos modelos son útiles no solo para enfrentar situaciones desconocidas y predecir resultados futuros, sino también para llenar los vacíos de información que puedan existir.

LeCun propone la creación de una arquitectura basada en seis módulos para lograr este objetivo. Estos módulos son los siguientes:

1. Módulo Configurador: Es responsable del control ejecutivo de los demás módulos. Coordina y supervisa el funcionamiento general del sistema.

2. Módulo de Percepción: Recibe señales de los sensores para comprender lo que está sucediendo en el entorno. Ayuda a la IA a captar información del mundo exterior.

3. Módulo de Modelo del Mundo: Permite estimar qué información falta en los datos proporcionados por la percepción y realiza predicciones sobre posibles estados futuros del mundo. Ayuda a completar los vacíos de información.

4. Módulo de Coste: Busca minimizar los costes a largo plazo. Aquí residen los impulsos básicos del comportamiento y las motivaciones intrínsecas que guían las acciones de la IA.

5. Módulo Actor: Optimiza la secuencia de acciones a realizar y ejecuta la primera acción de esa secuencia.

6. Módulo de Memoria a Corto Plazo: Se encarga de mantener un registro del estado actual y previsto del mundo, así como de los costes asociados. Ayuda a la IA a recordar información relevante para tomar decisiones.

Estos módulos trabajan en conjunto para permitir que la inteligencia artificial aprenda y razone de manera similar a los humanos, facilitando la adquisición de sentido común y la capacidad de tomar decisiones más informadas y contextualmente adecuadas.

Inteligencia artificial: Una nueva forma de creación de imágenes realistas y coherentes

El enfoque de I-JEPA para la creación de imágenes se diferencia de los sistemas generativos convencionales al incorporar modelos de sentido común en el proceso. A través de sus seis módulos, I-JEPA busca comprender el mundo exterior y predecir estados futuros plausibles. En lugar de comparar directamente los píxeles de las imágenes, el sistema utiliza representaciones abstractas para realizar comparaciones y generar imágenes coherentes y realistas.

El modelo se entrena con una gran cantidad de imágenes y descripciones de texto, descomponiendo las imágenes en una nube de píxeles y luego invirtiendo este proceso para reconstruir las imágenes originales. Sin embargo, a diferencia de otras IA generativas, I-JEPA utiliza su conocimiento del mundo y del sentido común para evitar errores comunes, como manos deformadas o con dedos adicionales.

El enfoque de I-JEPA permite crear imágenes más precisas y detalladas, mejorando la calidad general de las generaciones de imágenes a partir de texto. Este avance en la inteligencia artificial generativa ofrece nuevas posibilidades en campos como el diseño, el arte y la creación de contenido visual.

El sistema de I-JEPA se basa en la predicción de la representación de partes de una entrada, ya sea proveniente de una imagen o un texto, utilizando la información de otras partes de la misma entrada. Este enfoque permite completar la información faltante en una representación abstracta de manera similar a cómo los seres humanos comprendemos la información. Los estudios realizados por el objetivo han demostrado que este método tiene varias ventajas, incluida una mayor eficiencia en la generación de imágenes y el uso de computadoras de las computadoras, así como un menor impacto de los límites asociados con este tipo de tecnología.

No obstante, los investigadores enfatizan que esto es solo el comienzo y esperan ampliar el enfoque de JEPA a otros dominios, como los datos de imagen y texto emparejados, así como los datos de vídeo. En el futuro, los modelos JEPA podrían tener aplicaciones interesantes en tareas como la comprensión de vídeos, lo que abre la puerta a posibilidades aún más emocionantes en el campo de la inteligencia artificial y la generación de contenido visual.

Hyperion
Author: Hyperion

Otras Noticias

Compartir

Redes Sociales

Google News

Noticias

Noticias Relacionadas

0 comentarios

Enviar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Posibles Fuentes: Pagina de Fuentes