Anthropic revela custos de IA e analisa avanços da DeepSeek

CEO da Anthropic esclarece rumores sobre Claude Sonnet e avalia progresso da DeepSeek, destacando eficiência e custos reduzidos.

Por Emerson Alves

01 fevereiro

O cenário da inteligência artificial tem sido palco de intensos debates e especulações recentemente, especialmente após o surgimento de novos players como a DeepSeek. Em meio a rumores e conjecturas sobre os custos e capacidades dos modelos de IA mais avançados, Dario Amodei, CEO da Anthropic, veio a público para esclarecer algumas questões cruciais sobre o desenvolvimento do Claude 3.5 Sonnet e oferecer sua perspectiva sobre os avanços da DeepSeek.

Amodei revelou que o custo de treinamento do Claude 3.5 Sonnet, um modelo de linguagem considerado estado da arte, ficou na casa de "algumas dezenas de milhões de dólares". Esta informação contrasta fortemente com estimativas anteriores que sugeriam gastos na casa dos bilhões. O CEO também refutou rumores de que o Sonnet teria sido desenvolvido utilizando dados sintéticos gerados por modelos mais sofisticados e não divulgados.

Apesar de ter sido treinado há cerca de 9 a 12 meses, Amodei afirma que o Sonnet ainda mantém uma vantagem notável em diversas avaliações internas e externas, especialmente em tarefas práticas como programação e interação humana. Esta declaração vem em um momento em que a indústria de IA testemunha uma aceleração sem precedentes no desenvolvimento de modelos cada vez mais capazes e eficientes.

Eficiência e inovação no treinamento de IA

O CEO da Anthropic destacou que a verdadeira conquista técnica da DeepSeek não está no muito discutido modelo R1, mas sim no Deepseek-V3, lançado no final de dezembro. Este modelo introduziu melhorias significativas, incluindo uma abordagem avançada de "mistura de especialistas". Amodei argumenta que o R1, lançado posteriormente, baseia-se principalmente em abordagens já existentes.

A eficiência de custo alcançada pela DeepSeek não é incomum para a indústria, segundo Amodei. Ele aponta que o custo de treinamento de modelos de IA tipicamente cai cerca de 4 vezes por ano. Esta tendência de redução de custos permite que empresas menores e com menos recursos possam competir no desenvolvimento de IA avançada, potencialmente democratizando o acesso a esta tecnologia transformadora.

Amodei ressalta que, mesmo com essas eficiências, as empresas de IA ainda enfrentam custos significativos. A DeepSeek, por exemplo, teria investido em cerca de 50.000 chips da geração Hopper, avaliados em aproximadamente 1 bilhão de dólares. Isso coloca as reservas de GPU da empresa chinesa dentro de um fator de 2-3 das principais empresas de IA dos EUA.

Avanços em IA desafiam paradigmas de custo e eficiência no setor tecnológico. (Imagem: Reprodução/Canva)

Impacto das restrições de exportação na competição global

Um ponto crucial abordado por Amodei é o papel das restrições de exportação de chips para a China. Contrariando a narrativa de que o progresso da DeepSeek poderia indicar a ineficácia dessas restrições, o CEO da Anthropic argumenta que esses controles se tornam ainda mais importantes. Ele sustenta que o fato de a tecnologia de IA estar se tornando mais eficiente não é razão para suspender os controles.

Essas restrições, segundo Amodei, ajudam a prevenir que a China adquira milhões de chips, igualando as capacidades de IA dos EUA e potencialmente ganhando o que ele chama de "dominância militar". O CEO ressalta que os melhores chips de IA da China, a série Huawei Ascend, são substancialmente menos capazes que os chips líderes fabricados pela americana Nvidia.

A posição de Amodei reflete uma preocupação crescente no setor de tecnologia e entre formuladores de políticas sobre a manutenção da liderança dos EUA em IA, especialmente diante dos rápidos avanços de empresas chinesas como a DeepSeek. Este debate ganha ainda mais relevância considerando o potencial da IA para aplicações militares e de segurança nacional.

Perspectivas futuras para o desenvolvimento de IA

Olhando para o futuro, Amodei vê o aprendizado por reforço (RL) se tornando central para o escalonamento de modelos de IA. Esta nova abordagem, que impulsiona o Deepseek R1 e os modelos mais recentes da OpenAI, está apenas começando a mostrar seu potencial. O CEO sugere que o próximo lançamento da Anthropic provavelmente não será um LLM padrão, indicando uma possível mudança de direção na estratégia de desenvolvimento da empresa.

Amodei também faz previsões ousadas sobre o futuro da IA. Ele estima que o desenvolvimento de sistemas de IA mais capazes que a maioria dos humanos exigirá milhões de chips, "e é mais provável que aconteça em 2026-2027". Esta projeção coloca em perspectiva a velocidade vertiginosa com que a tecnologia de IA está avançando e os desafios de infraestrutura que as empresas enfrentarão para manter-se competitivas.

As revelações e análises de Amodei lançam luz sobre o complexo ecossistema de desenvolvimento de IA, onde eficiência, custo e geopolítica se entrelaçam. À medida que empresas como Anthropic e DeepSeek continuam a inovar, o setor de IA caminha para um futuro onde a capacidade de processar informações em escala sem precedentes pode redefinir os limites do possível em tecnologia e cognição humana.

Fonte: The Decoder

Emerson Alves

Analista de sistemas com MBA em IA, especialista em inovação e soluções tecnológicas.