Categorias
Mundo

Alibaba desafia DeepSeek com IA mais poderosa.E os EUA, hein!

Em plena ascensão da DeepSeek, a Alibaba lança um novo modelo de inteligência artificial que promete superar concorrentes e acirrar a disputa no setor de tecnologia A empresa chinesa de tecnologia Alibaba (9988.HK) lançou nesta quarta-feira (29) uma nova versão de seu modelo de inteligência artificial, o Qwen 2.5, que afirma superar o altamente aclamado […]

A empresa chinesa de tecnologia Alibaba (9988.HK) lançou nesta quarta-feira (29) uma nova versão de seu modelo de inteligência artificial, o Qwen 2.5, que afirma superar o altamente aclamado DeepSeek-V3.

Segundo a Reuters, o lançamento do Qwen 2.5-Max ocorreu em um momento incomum – no primeiro dia do Ano Novo Lunar, quando a maioria dos chineses está de folga e reunida com suas famílias. Isso evidencia a pressão imposta pela ascensão meteórica da startup chinesa de IA DeepSeek nas últimas três semanas, não apenas sobre concorrentes internacionais, mas também sobre rivais domésticos.

“O Qwen 2.5-Max supera… quase em todos os aspectos o GPT-4o, o DeepSeek-V3 e o Llama-3.1-405B”, afirmou a unidade de nuvem da Alibaba em um anúncio publicado em sua conta oficial no WeChat, referindo-se aos modelos de IA mais avançados da OpenAI e da Meta.

O lançamento do assistente de IA da DeepSeek em 10 de janeiro, alimentado pelo modelo DeepSeek-V3, assim como o lançamento do modelo R1 em 20 de janeiro, surpreendeu o Vale do Silício e derrubou ações de empresas de tecnologia. Os supostos baixos custos de desenvolvimento e uso da startup chinesa levaram investidores a questionar os enormes gastos planejados pelas principais empresas de IA dos Estados Unidos.

No entanto, o sucesso da DeepSeek também desencadeou uma corrida entre seus concorrentes domésticos para aprimorar seus próprios modelos de IA.

Dois dias após o lançamento do DeepSeek-R1, a ByteDance, dona do TikTok, lançou uma atualização de seu principal modelo de IA, alegando que superava o modelo o1 da OpenAI, apoiada pela Microsoft, no AIME – um teste de benchmark que mede a capacidade dos modelos de IA de compreender e responder a instruções complexas.

Essa alegação ecoa a da DeepSeek, que afirmou que seu modelo R1 rivaliza com o o1 da OpenAI em diversos benchmarks de desempenho.

DEEPSEEK E A DISPUTA COM OS RIVAIS DOMÉSTICOS
O antecessor do modelo DeepSeek-V3, o DeepSeek-V2, provocou uma guerra de preços entre modelos de IA na China após seu lançamento em maio do ano passado.

O fato de o DeepSeek-V2 ser de código aberto e ter um custo extremamente baixo – apenas 1 yuan (US$ 0,14) por 1 milhão de tokens (unidades de dados processadas pelo modelo de IA) – levou a unidade de nuvem da Alibaba a anunciar cortes de preços de até 97% em uma variedade de modelos.

Outras empresas chinesas de tecnologia seguiram o exemplo, incluindo a Baidu (9888.HK), que lançou o primeiro equivalente ao ChatGPT na China em março de 2023, e a Tencent (0700.HK), a empresa de internet mais valiosa do país.

Liang Wenfeng, o enigmático fundador da DeepSeek, afirmou em uma rara entrevista ao veículo chinês Waves, em julho, que a startup “não se importava” com a guerra de preços e que seu principal objetivo era alcançar a AGI (inteligência geral artificial).

A OpenAI define AGI como sistemas autônomos que superam os humanos na maioria das tarefas economicamente valiosas.

Enquanto grandes empresas chinesas de tecnologia como a Alibaba possuem centenas de milhares de funcionários, a DeepSeek opera como um laboratório de pesquisa, composto principalmente por jovens graduados e doutorandos das principais universidades chinesas.

Liang afirmou na entrevista de julho que acredita que as maiores empresas de tecnologia da China podem não estar bem preparadas para o futuro da indústria de IA, contrastando seus altos custos e estruturas rígidas com a operação enxuta e o estilo de gestão flexível da DeepSeek.

“Modelos fundamentais exigem inovação contínua, e as capacidades das gigantes da tecnologia têm seus limites”, disse ele.

Por Celeste Silveira

Produtora cultural

Comente