16 Febrero de 2024 17:44
La tecnología avanza más rápido que la capacidad del hombre para poder adaptarse a ella, un ejemplo de esto es la utilización tecnológica de la inteligencia artificial, que le permite al usuario realizar libros enteros con pocos requerimientos, videos e incluso clonar voces enteras.
Fue así como se hicieron virales imágenes de famosos que nunca fueron tomadas, canciones con las voces de varios artistas e incluso noticias falsas que debieron ser desmentidas por sus propios protagonistas. Sin embargo, la tecnología incrementa y pone cada vez más herramientas al alcance de la mano para saber cómo aprovechar.
Es por eso que la empresa estadounidense OpenAI, dueña del reconocido programa de escritura ChatGPT, lanzó al mercado "Sora", una nueva herramienta de video que se utiliza con inteligencia artificial, que es capaz de crear clips de alta calidad a partir de postulados de texto e imágenes que le brinden los usuarios, las cuales mientras más precisas sean, darán mejores resultados.
Sora es capaz de generar contenidos audiovisuales siempre que se le brinde una imagen y un mensaje como entrada, pero sin embargo, su uso está restringido a un número limitado de creadores, ya que podría usarse indebidamente. En este sentido, el ejecutivo de OpenAI, Sam Altman, al presentar al producto, indicó que se trata de un "modelo de generación de vídeo".
Además, la compañía remarcó que este nuevo sitio web debe ser utilizado con suma cautela ya que "es capaz de generar un minuto de vídeo de alta fidelidad. Nuestros resultados sugieren que escalar modelos de generación de video es un camino prometedor hacia la construcción de simuladores de propósito general del mundo físico". Además, anticipó que Sora es un modelo generalista de datos visuales, ya que puede generar vídeos e imágenes de diversas duraciones, relaciones de aspecto y resoluciones, hasta un minuto completo de vídeo de alta definición.
"Nos inspiramos en grandes modelos de lenguaje que adquieren capacidades generalistas mediante el entrenamiento con datos a escala de Internet. El éxito del paradigma LLM se debe en parte al uso de tokens que unifican elegantemente diversas modalidades de texto: código, matemáticas y varios lenguajes naturales", aseveró la empresa.
Sin embargo, OpenAI reconoció que este simulador de Inteligencia Artificial todavía está en sus inicios y que presenta numerosas limitaciones como simulador, ya que por ejemplo, no modela con precisión la física de muchas interacciones básicas, como la rotura de cristales. Otras interacciones, como comer, no siempre producen cambios correctos en el estado del objeto.
"El escalamiento continuo de modelos de video es un camino prometedor hacia el desarrollo de simuladores capaces del mundo físico y digital, y de los objetos, animales y personas que viven dentro de ellos", informaron.