Liang Wenfeng, o misterioso homem que fundou a DeepSeek

O homem que fundou a DeepSeek, a empresa de inteligência artificial que abalou o mercado de ações dos EUA, é Liang Wenfeng, de 40 anos, um antigo gestor de fundos de investimento que disse ter mudado para a tecnologia para colmatar o fosso entre a China e os EUA na indústria da IA. Liang disse…
ebenhack/AP
Liang Wenfeng, de 40 anos, um antigo gestor de fundos de investimento é o cérebro por detrás do DeepSeek. O que se conhece do pouco que se sabe deste chinês misterioso.
Líderes

O homem que fundou a DeepSeek, a empresa de inteligência artificial que abalou o mercado de ações dos EUA, é Liang Wenfeng, de 40 anos, um antigo gestor de fundos de investimento que disse ter mudado para a tecnologia para colmatar o fosso entre a China e os EUA na indústria da IA.

Liang disse à agência chinesa Waves que cresceu em Guangdong, na China, na década de 1980 – alegadamente filho de professores da zona, que é agora conhecida pela sua indústria tecnológica – e que mais tarde obteve uma licenciatura e um mestrado em engenharia de informação e comunicação na Universidade de Zhejiang, segundo a Reuters.

Em 2015, Liang co-fundou a High-Flyer, um fundo que se baseia em “matemática e IA” para criar estratégias de investimento.

A High-Flyer criou o seu primeiro modelo de IA em outubro de 2016, permitindo que a empresa assumisse a sua primeira posição em ações com base em projeções de IA, depois de anteriormente se basear em “algoritmos tradicionais de aprendizagem automática”.

A High-Flyer começou a usar modelos de IA para desenvolver quase todas as suas posições em ações em 2017, após o que o fundo de hedge contratou uma equipa de pesquisa dedicada a “algoritmos de IA e [suas] aplicações básicas”.

Liang começou a acumular milhares de processadores gráficos Nvidia para um projeto de IA então sem nome em 2021, pouco antes de o governo Biden restringir o comércio desses chips para a China, de acordo com o Financial Times.

“Quando o conhecemos, ele era um tipo muito nerd com um penteado horrível que falava em construir um cluster de 10.000 chips para treinar os seus próprios modelos. Não o levámos a sério”, disse um dos parceiros de negócios de Liang ao FT. “Ele não conseguia articular a sua visão para além de dizer: ‘Quero construir isto, e será uma mudança no jogo’. Pensámos que isto só seria possível com gigantes como a ByteDance e a Alibaba”.

O facto é que Liang fundou a DeepSeek em 2023, e a empresa dependia de maximizar a produção de processadores disponíveis na China, embora não pudesse adquirir os chips da Nvidia, informou o Financial Times, citando um pesquisador de IA próximo à empresa.

Quais são os laços de Liang Wenfeng com o governo chinês?

Liang falou num evento à porta fechada para o primeiro-ministro chinês Li Qiang com peritos de outras indústrias em 20 de janeiro, de acordo com um resumo do evento traduzido pelo Washington Post. Li disse durante o evento que o governo chinês deveria “concentrar-se em avanços em tecnologias-chave e tecnologias de ponta”. Alguns meios de comunicação locais citam declarações de governos provinciais e municipais da China, avança o Post, além de um especialista em IA da Universidade de Pequim que referiu que o DeepSeek poderia “criar milagres”.

Liang disse à agência de tecnologia chinesa 36Kr que a China deve “fazer uma transição gradual” para ser um contribuinte na indústria de IA, “em vez de continuar a andar na cauda dos outros”, de acordo com uma tradução do Post. A China será “sempre um seguidor” na indústria, a menos que o país feche uma “lacuna de um ou dois anos” com a IA nos EUA, disse Liang.

O que é o Deepseek?

A DeepSeek, alegadamente fundada por Liang com um capital de 1,4 milhões de dólares, lançou os seus modelos de código aberto para download nos EUA no início deste mês. O modelo de IA da DeepSeek rapidamente saltou para o topo das tabelas de download do iPhone, inclusive à frente do ChatGPT da OpenAI. A DeepSeek afirma que i seu produto supera os modelos rivais em tarefas matemáticas, conhecimento geral e benchmarks de desempenho de perguntas e respostas. O modelo de raciocínio avançado R1 da DeepSeek foi comparado a produtos semelhantes fabricados pela OpenAI e pela Meta, embora pareçam ser mais eficientes, com custos mais baixos para treinar e desenvolver modelos. A empresa diz que desenvolveu o seu modelo por uma pequena fração do custo da maioria dos concorrentes americanos, o que abalou os fabricantes de chips americanos e as empresas centradas na IA – embora alguns cépticos tenham questionado se o verdadeiro custo é superior ao que a DeepSeek afirma. No entanto, o modelo também se recusa a responder a perguntas sobre alguns tópicos controversos, incluindo questões sobre o tratamento dado pela China aos uigures, o estatuto de Taiwan em relação à China e o que aconteceu na Praça Tiananmen em 1989. A Chatbot Arena, uma plataforma de desempenho sediada na Universidade da Califórnia, em Berkeley, classifica os modelos R1 e V3 da DeepSeek entre seus 10 principais produtos, inclusive à frente de alguns modelos desenvolvidos pela OpenAI, Google e xAI de Elon Musk. Ainda assim, Liang disse ao 36Kr que os avanços da empresa em IA são limitados porque o DeepSeek não consegue aceder os chips desenvolvidos pela Nvidia.

O que o Deepseek diz sobre Liang Wenfeng?

Quando o DeepSeek é questionado sobre o histórico de Liang, o chatbot de IA respondeu à Forbes que não há informações disponíveis publicamente sobre Liang, incluindo o seu “local de origem ou histórico educacional”. O DeepSeek também observa que os detalhes sobre a vida pessoal e a formação académica de Liang não são “amplamente divulgados”, pois ele manteve um “perfil relativamente baixo em comparação com alguns outros empreendedores de tecnologia”. A Associated Press foi a primeira a perguntar sobre Liang no seu próprio chatbot.

Ty Roush/Forbes Internacional

Mais Artigos