Nova versão melhora sincronização entre imagem e áudio e reduz tempo de geração de conteúdos
Empresa procura competir com modelos de vídeo desenvolvidos por rivais como Google, OpenAI e Runway
A xAI lançou o Grok Imagine Video 1.5, uma nova versão do seu modelo de geração de vídeo por inteligência artificial que introduz melhorias na qualidade visual, na sincronização entre imagem e áudio e na velocidade de produção de conteúdos. A actualização fica disponível através da plataforma Grok, da interface web e da API destinada a programadores.
A principal novidade da versão 1.5 é a capacidade de gerar vídeo e áudio em simultâneo durante um único processo de criação. O sistema produz automaticamente efeitos sonoros, ruído ambiente, música e diálogos sincronizados com o movimento das personagens, melhorando igualmente a sincronização labial em relação à versão anterior.
A xAI afirma também ter reduzido significativamente o tempo necessário para criar cada vídeo. Segundo a empresa, os tempos de processamento foram praticamente reduzidos para metade, permitindo gerar vídeos em resolução até 720p em poucos segundos, dependendo da complexidade da solicitação.
O Grok Imagine Video 1.5 permite criar vídeos a partir de descrições em texto ou de imagens estáticas, preservando a identidade dos objectos e personagens presentes na imagem original. O modelo suporta igualmente a continuação de cenas através da extensão automática de vídeos, facilitando a produção de sequências mais longas sem alterar o estilo visual.
Além da melhoria na qualidade visual, a empresa destaca uma maior consistência dos movimentos, melhor interpretação das instruções fornecidas pelos utilizadores e uma reprodução mais natural de expressões faciais e movimentos de câmara. Estas alterações procuram aproximar o modelo de aplicações profissionais, como produção publicitária, conteúdos para redes sociais, demonstrações de produtos e prototipagem criativa.
O lançamento reforça a estratégia da xAI para competir no mercado da geração de vídeo por inteligência artificial, um dos segmentos mais disputados da indústria tecnológica. Empresas como a Google, a OpenAI e a Runway têm vindo a acelerar o desenvolvimento de modelos capazes de produzir vídeos cada vez mais realistas, com maior controlo criativo e tempos de processamento mais reduzidos.
Apesar das melhorias, o Grok Imagine Video 1.5 continua orientado sobretudo para a criação de vídeos curtos. Os conteúdos podem atingir até 15 segundos de duração e resolução máxima de 720p, sendo possível prolongar sequências através da funcionalidade de extensão de vídeo disponibilizada pela plataforma.




