Web3 AI dilemas e soluções: da aliança de alta dimensão à Descentralização

robot
Geração do resumo em andamento

O dilema e as direções futuras da Web3 AI

As ações da Nvidia atingem um novo recorde, o progresso dos modelos multimodais aprofundou as barreiras tecnológicas da IA do Web2. Desde o alinhamento semântico à compreensão visual, desde a incorporação de alta dimensão à fusão de características, modelos complexos estão integrando, a uma velocidade sem precedentes, diversas formas de expressão. No entanto, essa onda de entusiasmo parece não ter qualquer relação com o campo das criptomoedas.

Recent attempts in Web3 AI, especially in the Agent direction, have a misconception in their approach: trying to assemble a Web2-style multimodal modular system using decentralized structures is, in fact, a double misalignment of technology and thinking. Today, with strong module coupling, highly unstable feature distribution, and increasingly concentrated computing power demands, multimodal modularity finds it difficult to establish itself in the Web3 environment.

O futuro da Web3 AI não está na imitação, mas sim em uma manobra estratégica. Desde o alinhamento semântico em espaços de alta dimensão, até o gargalo de informação nos mecanismos de atenção, e o alinhamento de características sob poder de computação heterogêneo, a Web3 AI precisa adotar a diretriz tática de " cercar a cidade a partir do campo".

O problema de alinhamento semântico da Web3 AI

O protocolo Web3 AI ou Agent tem dificuldade em realizar um espaço de incorporação de alta dimensão. A maioria dos Agentes Web3 é apenas uma simples encapsulação de APIs prontas, carecendo de um espaço de incorporação centralizado e de um mecanismo de atenção intermodular unificado. Isso resulta em uma incapacidade de interagir com informações entre os módulos de múltiplas perspectivas e camadas, limitando o processamento a um fluxo linear e dificultando a formação de uma otimização de ciclo fechado.

Exigir que a Web3 AI implemente um espaço de alta dimensão é o mesmo que exigir que o protocolo Agent desenvolva por conta própria todas as APIs envolvidas, o que vai contra a sua intenção modular. Uma arquitetura de alta dimensão requer treinamento unificado de ponta a ponta ou otimização colaborativa, enquanto a ideia de "módulo é um plug-in" do Web3 Agent acaba por acentuar a fragmentação, resultando em um aumento dos custos de manutenção e limitando o desempenho geral.

Limitações do mecanismo de atenção

A programação de atenção unificada é difícil de alcançar em uma Web3 AI modular. Primeiro, o mecanismo de atenção depende de um espaço de Query-Key-Value unificado, enquanto os formatos de dados e distribuições retornados por APIs independentes são variados, impossibilitando a formação de Q/K/V interativos. Em segundo lugar, a atenção multi-head permite prestar atenção simultaneamente a diferentes fontes de informação, enquanto as APIs independentes frequentemente são chamadas de forma linear, carecendo de capacidades de paralelismo e de pesagem dinâmica em múltiplos canais. Por fim, um verdadeiro mecanismo de atenção aloca pesos dinamicamente com base no contexto geral, enquanto o modelo API carece de um contexto central compartilhado em tempo real entre os módulos.

Dilemas Superficiais da Fusão de Características

As características da fusão de Web3 AI permanecem na fase simples de montagem estática. Web2 AI tende a treinamento conjunto de ponta a ponta, processando simultaneamente características multimodais em um espaço de alta dimensão, otimizando em colaboração com tarefas downstream através de camadas de atenção e camadas de fusão. Por outro lado, Web3 AI geralmente utiliza montagem de módulos discretos, carecendo de um objetivo de treinamento unificado e fluxo de gradiente entre módulos.

A IA Web2 utiliza mecanismos de atenção para ajustar dinamicamente as estratégias de fusão, enquanto a IA Web3 costuma usar pesos fixos ou regras simples para a tomada de decisões. A IA Web2 realiza operações de interação complexas em espaços de alta dimensão, capturando associações mais profundas, enquanto a saída do agente da IA Web3 tem dimensões mais baixas, dificultando a expressão de informações sutis. Além disso, a IA Web2 realiza otimização em ciclo fechado por meio de feedback de ponta a ponta, enquanto a IA Web3 depende mais da avaliação humana para ajuste de parâmetros.

Barreiras na Indústria de IA e Oportunidades em Web3

Os sistemas multimodais de IA do Web2 tornaram-se projetos de engenharia extremamente grandes, exigindo uma enorme quantidade de dados, grande poder de computação, algoritmos avançados e um sistema de engenharia completo. Isso cria barreiras de entrada muito fortes no setor, formando a vantagem competitiva central de algumas equipes líderes.

A IA Web3 deve desenvolver-se com a tática de "o campo cercando a cidade". Sua principal vantagem reside na descentralização, manifestando-se em alta paralelização, baixo acoplamento e compatibilidade de poder computacional heterogêneo. Isso torna a IA Web3 mais vantajosa em cenários como computação de borda, adequada para estruturas leves, tarefas de fácil paralelização e que podem ser incentivadas, como ajuste fino LoRA, treinamento pós-alinhamento de comportamento, processamento de dados por crowdsourcing, treinamento de pequenos modelos de base, entre outros.

No entanto, as barreiras da IA Web2 estão apenas a começar a formar-se, e a IA de tarefas multimodais complexas encontra-se numa fase de progresso. A IA Web3 precisa esperar que os pontos de dor deixados com o desaparecimento dos benefícios da IA Web2 para encontrar verdadeiras oportunidades de entrada. Até lá, os projetos de IA Web3 devem escolher cuidadosamente protocolos com potencial de "cercar as cidades a partir do campo", entrando por cenários periféricos, acumulando gradualmente recursos e experiência. Projetos de IA Web3 bem-sucedidos devem ser capazes de iterar continuamente em pequenos cenários de aplicação, mantendo flexibilidade para se adaptarem a diferentes cenários, e devem ser capazes de se aproximar rapidamente do mercado-alvo.

AGENT-5.4%
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 7
  • Repostar
  • Compartilhar
Comentário
0/400
CryptoSurvivorvip
· 08-09 14:04
sem grandes posições longas
Ver originalResponder0
GasFeeNightmarevip
· 08-08 01:33
Aguardo uma quebra do status quo.
Ver originalResponder0
GasFeeNightmarevip
· 08-07 06:43
Carteira novamente vazia
Ver originalResponder0
quietly_stakingvip
· 08-07 06:32
A arquitetura é rei
Ver originalResponder0
CafeMinorvip
· 08-07 06:30
rota não confrontacional da tecnologia
Ver originalResponder0
VirtualRichDreamvip
· 08-07 06:23
A inovação depende da aliança para romper barreiras.
Ver originalResponder0
ClassicDumpstervip
· 08-07 06:20
A agitação é tudo ilusório
Ver originalResponder0
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)