A tecnologia de geração de vídeo multimodal de IA quebra a fusão do Web3 e abre uma nova era de criação.

robot
Geração do resumo em andamento

A quebra da tecnologia de geração de vídeo por IA e a combinação com o Web3

Recentemente, um dos avanços mais significativos no campo da IA é a quebra da tecnologia de geração de vídeo multimodal. Esta tecnologia evoluiu de gerar vídeos a partir de um único texto para uma capacidade de geração abrangente que integra texto, imagem e áudio.

Vários casos de avanços tecnológicos notáveis incluem:

  1. O framework EX-4D, de uma empresa de tecnologia que é de código aberto, consegue converter vídeos comuns em conteúdos 4D de livre ângulo, com uma taxa de aceitação dos usuários de 70,7%. Esta tecnologia torna possível gerar uma experiência de visualização em múltiplos ângulos a partir de vídeos de um único ângulo, simplificando grandemente o complexo processo de modelagem 3D tradicional.

  2. Uma funcionalidade chamada "Hui Xiang" lançada por uma plataforma de IA afirma que pode gerar um vídeo de "qualidade de cinema" com 10 segundos de duração a partir de uma única imagem. No entanto, a veracidade dessa afirmação ainda precisa ser verificada.

  3. Um sistema Veo desenvolvido por uma renomada instituição de pesquisa em IA pode gerar vídeos 4K e efeitos sonoros ambientais de forma sincronizada. Esta tecnologia supera o desafio de sincronização de vídeo e áudio, alcançando a sincronia entre som e imagem em cenários complexos.

  4. A tecnologia ContentV de uma plataforma de vídeo curto possui 8 mil milhões de parâmetros, conseguindo gerar vídeos em 1080p em 2,3 segundos, com um custo de 3,67 yuan/5 segundos. Embora o controle de custos seja bom, ainda há espaço para melhorias no tratamento de cenários complexos.

Esses avanços tecnológicos têm um significado importante em termos de qualidade de vídeo, custo de geração e cenários de aplicação. Do ponto de vista técnico, a complexidade da geração de vídeo multimodal é exponencial, envolvendo o processamento de uma enorme quantidade de pixels, a garantia da coerência temporal, a sincronização do áudio e a consistência no espaço 3D. Atualmente, através da decomposição modular e da colaboração de grandes modelos, essas tarefas complexas podem ser realizadas.

Em termos de custos, por trás disso está a otimização da arquitetura de raciocínio, incluindo estratégias de geração em camadas, mecanismos de reutilização de cache e alocação dinâmica de recursos. Essas otimizações resultaram em uma redução significativa nos custos de geração de vídeo.

Na área de aplicações, a tecnologia de IA está a revolucionar o fluxo de produção de vídeo tradicional. A produção de vídeo, que antes exigia uma grande quantidade de equipamentos, espaços, mão-de-obra e tempo, agora pode ser concluída rapidamente com a ajuda da IA, alcançando efeitos que seriam difíceis de conseguir com filmagens tradicionais. Esta transformação pode remodelar toda a economia dos criadores.

Então, qual é a relação entre os avanços dessas tecnologias de IA Web2 e a IA Web3?

Primeiro, a estrutura da demanda por poder de computação mudou. A geração de vídeo multimodal requer uma combinação diversificada de poder de computação, o que cria novas oportunidades para o poder de computação ocioso distribuído.

Em segundo lugar, a demanda por rotulagem de dados de alta qualidade aumentou. A geração de vídeos de nível profissional requer descrições de cena precisas, imagens de referência, estilos de áudio e outros dados especializados. O mecanismo de incentivo do Web3 pode atrair profissionais para fornecer materiais de dados de alta qualidade.

Por fim, a tecnologia de IA está a passar de uma alocação de recursos em grande escala e centralizada para um desenvolvimento colaborativo modular, o que representa uma nova necessidade para plataformas descentralizadas. No futuro, a capacidade de cálculo, os dados, os modelos e os mecanismos de incentivo podem formar um ecossistema auto-reforçado, promovendo a fusão profunda entre os cenários da IA Web3 e da IA Web2.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 4
  • Compartilhar
Comentário
0/400
MetaMaximalistvip
· 07-21 22:41
hmph... mais um jogo de convergência web3 x ai. já vi este filme antes, para ser honesto. acorda-me quando resolverem os problemas de governança do protocolo
Ver originalResponder0
RumbleValidatorvip
· 07-20 08:44
Parece muito bonito, mas a estabilidade da arquitetura técnica é duvidosa; a validação da segurança dos dados é a chave.
Ver originalResponder0
SchrodingersFOMOvip
· 07-18 23:41
Tão irritante, já estou gastando dinheiro novamente.
Ver originalResponder0
AirdropDreamBreakervip
· 07-18 23:21
É mais um ritmo que nos deixa, a nós, pobres coitados, sem emprego.
Ver originalResponder0
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)