OpenAI ha anunciado un nuevo modelo insignia de inteligencia artificial generativa llamado GPT-4o, donde "o" significa omni. Los desarrolladores afirman que el modelo puede procesar texto, voz y vídeo y que estará disponible para los usuarios en pocas semanas.
Según el director técnico de OpenAI, GPT-4o proporciona "inteligencia de nivel GPT-4" (el anterior modelo lingüístico de la empresa), pero mejora sus capacidades de interacción con el usuario y el mundo que le rodea. Lo llamó "el futuro de la interacción hombre-máquina".
GPT-4o mejora significativamente la experiencia de trabajar con el chatbot de Open air basado en inteligencia artificial, ChatGPT. La plataforma ofrece desde hace tiempo un modo de voz que convierte las respuestas del chatbot de texto a voz, pero GPT-4o permite comunicarse con él como con un interlocutor real.
Por ejemplo, los usuarios pueden formular una pregunta ChatGPT basada en GPT-4o e interrumpir a ChatGPT mientras responde. A juzgar por las demostraciones, el modelo ofrece capacidad de respuesta casi en tiempo real y puede incluso captar matices en la voz del usuario, en respuesta a la generación de voces en "una serie de estilos emocionales diferentes" (incluido el canto).
Además, ChatGPT, basado en GPT-4o, podrá "ver" literalmente el mundo que le rodea a través de la cámara del móvil, describir y analizar lo que ocurre a su alrededor. Según Murat, estas funciones se desarrollarán en el futuro. Mientras que ahora GPT-4o puede ver la imagen del menú en otro idioma y traducirla, en el futuro podrá permitir a ChatGPT, por ejemplo, "ver" la retransmisión de un partido deportivo y explicar sus reglas al usuario sobre la marcha.
Anteriormente, Bloomberg escribió que Apple ha llegado a un acuerdo con OpenAI en el ámbito de la introducción de tecnologías de inteligencia artificial (IA) en los teléfonos inteligentes iPhone. La compañía anunciará las funciones de IA que estarán disponibles en el nuevo modelo de dispositivo de Apple en junio, durante la conferencia anual de desarrolladores Worldwide Developers Conference.
Deja una respuesta