Ok, mas o DeepSeek é tudo isso que estão falando?

Segundo Renato Monteiro, o DeepSeek é uma solução capaz de brigar com os grandes modelos de Inteligência Artificial do mercado.

221

Conversamos sobre o DeepSeek com Renato Monteiro, especialista em negócios digitais e inovação.

Qual a sua avaliação sobre o DeepSeek?

No meu dia a dia, eu uso muito as soluções de Inteligência Artificial (IA) para que elas possam me ajudar no meu trabalho de produção e estruturação de conteúdo. Nesse contexto, eu tenho aplicado no DeepSeek os mesmos prompts, que normalmente uso em soluções conhecidas, como o ChatGPT e o Claude, para comparar os padrões de resposta e verificar se eles seguem uma linha semelhante, de forma a que eu possa entender se o hype que está havendo realmente é justificável.

Até agora, os resultados têm sido bastante impressionantes, com o DeepSeek sendo consistente nos seus outputs e conseguindo me ajudar no meu trabalho. Dessa forma, a minha primeira impressão foi muito positiva, pois, realmente, nós estamos diante de uma solução capaz de brigar com os grandes modelos.

O DeepSeek é tudo isso que estão falando ou está havendo exageros?

Nós vivemos um momento de muito entusiasmo sobre tudo o que é novidade. Em 2022, o ChatGPT gerou impactos e surpresas na comunidade e mesmo quem estava sabendo dos avanços da IA ficou impressionado com a capacidade do ChatBot em simular uma conversa em linguagem natural. Desde então, nós vimos a evolução dos grandes modelos, que se tornaram mais apurados e com mais informações. Alguns, inclusive, já começaram a fazer buscas na internet para trazer informações mais recentes. O grande entusiasmo, ou ansiedade, sobre o DeepSeek está relacionado ao fato de ele ter sido treinado com uma fração do investimento que tem sido utilizado pelos modelos americanos e de estar entregando um resultado bastante semelhante e com muito potencial.

Espaço Publicitáriocnseg

O que se sabe sobre a infraestrutura sobre a qual roda o DeepSeek?

Como eu não consegui encontrar muitas informações sobre o que está por detrás do DeepSeek, é muito difícil fazer qualquer tipo de afirmação em relação à sua infraestrutura. O que eu consegui levantar foi que há cinco anos um fundo de investimento de um bilionário chinês começou a fazer a aquisição de alguns chips da Nvidia, que eram um pouco mais ultrapassados e que não são comparáveis aos chips que estão, atualmente, nas infraestruturas dos grandes players. Isso chama a atenção, pois em pouco mais de quatro anos surgiu o DeepSeek com um modelo treinado a partir da utilização de chips de segunda prateleira, mas capaz de entregar um nível de performance consistente.

O que se sabe sobre o treinamento do DeepSeek?

Ainda não foi esclarecida a forma como esse modelo foi treinado. Existem engenheiros, no Vale do Silício, que estão céticos em relação à história, que está sendo contada, de que o DeepSeek é um grande modelo treinado com um investimento de US$ 6 milhões. Inclusive, alguns deles afirmam que o treinamento se deu a partir do modelo da OpenAI, como se a DeepSeek tivesse usado o ChatGPT como um atalho para se treinar. Agora, o que impressiona é que o output que ele entrega é super compatível com os outputs entregues pela OpenAI, Anthropic e Meta.

De onde vem os dados do DeepSeek? O que ele consulta para entregar as suas respostas?

Eu acredito que seja a mesma base de dados que alimenta os modelos da OpenAI e da Meta. Tudo que está na internet, e que é livre de direito autoral, pode ser usado como treinamento para esses modelos. Pela proximidade, qualidade e precisão das respostas, tudo leva a crer que esses modelos usam a mesma base de dados. O que pode mudar são os guardrails de cada modelo, mas aí seria necessário analisar os códigos para entender as travas que evitam respostas com vieses.

Em termos técnicos, o impacto nas ações das empresas americanas, com destaque para a Nvidia, se justifica?

Ainda é difícil dizer algo sobre isso. Isso porque se for verdade que o DeepSeek foi treinado com uma fração do investimento e com chips menos modernos que os atuais, toda a lógica de valorização da Nvidia, formulada a partir do lançamento de chips mais potentes e performáticos, fica um pouco fragilizada, já que começam a haver alternativas de treinamento de grandes modelos de IA que não necessariamente passam por soluções mais de ponta. Se essa história tiver fundamento, e se ela tiver acontecido desse jeito, esse impacto pode se justificar.

Nós também tivemos outros impactos. A OpenAI ficou assustada com esse movimento. Com relação à Meta, a empresa ficou bastante incomodada com o lançamento do DeepSeek, pois assim como o LLaMA (Large Language Model Meta AI), ele é um modelo de código aberto. Até então, a Meta era o único grande player que estava implementando um modelo desse tipo na expectativa de que os aplicativos que o utilizassem, incluindo os da própria Meta, se tornassem mais rentáveis que a venda do próprio modelo. Como agora o mercado tem um novo player, que parece demandar muito menos investimentos para treinar um modelo semelhante e que também tem a mesma estratégia de código aberto, quem mais sofrer com isso tudo, ao meu ver, vai ser a Meta.

Na sua opinião, que caminho o DeepSeek está mostrando?

Como a geração de energia elétrica é o principal emissor de gás carbônico do mundo, e o mundo vive uma crise climática, se a solução do DeepSeek se comprovar verdadeira, ela vai abrir um novo horizonte onde não serão necessários tantos investimentos para a criação de grandes datacenters para o processamento de IAs, o que pode colocar todo o ecossistema em uma direção mais sustentável.

Além disso, se tomarmos como referência a OpenAI, que em pouco tempo atingiu um valuation absurdo por conta dos investimentos que recebeu, o DeepSeek mostra que outras empresas podem desenvolver seus modelos de forma mais acessível, sem a necessidade de tanto capital, o que tende a fazer com que a tecnologia fique mais disponível para o grande público. Por exemplo, não faz muito tempo que a OpenAI estava estudando o formato de assinatura, de até US$ 2 mil mensais, para que as pessoas tivessem acesso a modelos mais completos, modernos e performáticos. Como existe um grande ceticismo em relação à capacidade desses players de gerarem receita e de serem sustentáveis economicamente, o DeepSeek acaba trazendo mais possibilidades para o desenrolar desse jogo.

Não está havendo um exagero nas comparações que estão sendo feitas de outras IAs com o DeepSeek? Faço essa pergunta, pois, muitas vezes, as IAs são tratadas como se fossem uma coisa só, quando na verdade elas são diferentes, possuem treinamentos diferentes, propósitos diferentes e rodam em infraestruturas diferentes.

Os modelos 4o da OpenAI, o LLaMA da Meta e o Sonnet e o Claude da Anthropic, possuem propósitos muito semelhantes. O o1, da OpenAI, é um pouco diferente, pois propõe uma linha de raciocínio. Quando eu fiz o teste de fórmulas matemáticas, todos os grandes modelos seguiram a mesma linha de raciocínio e chegaram ao mesmo resultado. Então não é isso que vai fazer do DeepSeek uma solução muito diferente.

O hype está no fato de que ele vem da China, de um lugar que talvez não se esperasse tanto, e com uma fração do custo. Foi essa “fração do custo” que desencadeou todo esse burburinho, o que fez com que os investidores começassem a se questionar se eles não estão investindo em empresas que poderiam estar alcançando resultados muito mais expressivos com muito menos dinheiro.

Considerando a conversa que tivemos, você gostaria de acrescentar algum ponto à sua entrevista?

Pelo que estou lendo nos veículos mais especializados, principalmente os lá de fora, nenhum deles está sabendo muito bem quais serão os possíveis efeitos do DeepSeek. Trump tem uma linha muito nacionalista, que está causando uma incerteza geopolítica bizarra, e a guerra dos chips está acontecendo há bastante tempo. Como os Estados Unidos já estavam tentando impedir os esforços da China nesse campo, restringindo a exportação de chips e de equipamentos, eles podem apertar ainda mais as restrições, o que tende a impactar todas as empresas da cadeia de suprimentos de IA, ou fazer um trabalho com os empreendedores de tecnologia do Vale do Silício para encontrar alternativas.

Em termos geopolíticos, o surgimento do DeepSeek vai fazer com que o mundo olhe de forma mais atenta para a China, que possui um plano muito ousado para se tornar a grande nação de IA nos próximos anos.

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui