A Silicon Flow acelera a sua IPO com dificuldades, será que uma fábrica de tokens é um bom negócio?

撰文: Xiaobing

Num dia no final de 2023, no restaurante de bolinhos Xi Jia De, ao pé do Parque de Ciência e Tecnologia de Tsinghua, Yuan Jinhui mal se tinha sentado quando ouviu a mesa ao lado a comentar a sua empresa: "A OneFlow tem boa tecnologia, mas no final não ganhou dinheiro e foi adquirida."

Mais tarde, ao recordar esta cena ao LatePost, disse que às vezes pensava se não teria criado um mau exemplo: o julgamento técnico estava certo, trabalhou diligentemente, mas ainda assim não conseguiu o sucesso reconhecido por todos.

Dois anos e meio depois, a 30 de junho de 2026, ele estava à porta da Bolsa de Valores de Hong Kong com um prospeto de 347 páginas. Desta vez, queria provar a proposição questionada naquele restaurante de bolinhos: a boa tecnologia pode ganhar dinheiro.

No entanto, o prospeto apresentou primeiro um resultado intermédio cruel: em 2025, por cada 1 yuan que a empresa faturava, só os custos diretos consumiam 1,2 yuan.

Que tipo de empresa é esta?

A SiliconFlow não faz grandes modelos nem fabrica chips. O que faz pode ser explicado numa frase: aluga capacidade de computação a montante, processa-a em Tokens e vende-os a jusante.

O papel da SiliconFlow é semelhante ao de uma refinaria de petróleo.

Uma refinaria não tem os seus próprios poços de petróleo; compra petróleo bruto, processa-o em gasolina e vende-o, ganhando a diferença. A SiliconFlow também não tem poços de petróleo: aluga GPUs da NVIDIA a fornecedores de cloud, bem como chips chineses como Ascend, Muxi e Moore Threads. Usa o seu próprio motor de inferência para processar estas diversas capacidades de computação em Tokens padrão, vendendo-os por quantidade a programadores e empresas. A renda é o seu preço de custo, o Token é o seu preço de retalho, e a diferença é a sua margem de lucro.

O problema é que esta diferença é agora negativa.

Em 2024, quando a empresa ainda era pequena, este negócio dava lucro, com uma margem bruta de 39,4% na diferença entre compra e venda.

Em 2025, a receita disparou 653,2%, atingindo 55,33 milhões de yuans, mas a margem bruta caiu para -24%. O negócio de Tokens em cloud pública, o mais vendido, teve uma margem bruta de -119%, o que equivale a perder 119 yuans por cada 100 yuans de Tokens vendidos.

Porquê?

Por um lado, o custo de aquisição é caro: para acomodar a enorme quantidade de utilizadores que pode surgir a qualquer momento, a empresa teve de alocar antecipadamente uma grande quantidade de capacidade de computação. Em 2025, o custo das vendas disparou de 4,452 milhões de yuans no ano anterior para 68,632 milhões, ultrapassando a receita total do ano, e a capacidade de computação alocada não foi totalmente utilizada.

Por outro lado, o preço de retalho foi esmagado: as grandes empresas, para conquistar programadores, reduziram os preços repetidamente. O preço por mil Tokens de alguns modelos principais caiu mais de 90%. Em maio deste ano, a DeepSeek anunciou uma redução permanente de 75% no V4-Pro, e a Tencent Cloud acompanhou, com algumas reduções de até 97,5%.

Mais problemático é que nem o preço de custo nem o preço de retalho são definidos pela SiliconFlow. A renda da capacidade de computação é fixada pelos fornecedores de cloud a montante; o preço dos Tokens é definido pela guerra de preços das grandes empresas. A Alibaba e a ByteDance baixam os preços para subsidiar com os lucros de outros negócios e conquistar território. Para um player independente como a SiliconFlow, que depende apenas da diferença de preços, cada anúncio de redução de preços equivale a ver os seus lucros a serem cortados.

Fluxo avassalador de tráfego, contas avassaladoras

O momento mais glorioso desta empresa iluminou precisamente esta lógica.

A 1 de fevereiro de 2025, a DeepSeek tornou-se viral globalmente, os seus servidores oficiais ficaram sobrecarregados, e milhões de utilizadores não conseguiam aceder.

A SiliconFlow aproveitou esta janela, uniu-se à Huawei Cloud e, utilizando chips Ascend, foi a primeira a lançar os serviços completos do R1 e V3, absorvendo a multidão que transbordava. Combinado com a estratégia de aquisição de utilizadores "registe-se e ganhe 14 yuans, convide e ganhe mais 14 yuans", o tráfego do site disparou quase 40 vezes. O número de utilizadores registados passou de 127 mil no final de 2024 para 10,28 milhões no final de abril deste ano; a plataforma processa 578,5 mil milhões de Tokens por dia, com um pico de 1,07 biliões de Tokens num único dia. Com base no volume de processamento de 2025, é já a maior plataforma independente de fornecimento de Tokens da China.

A conta está noutras páginas: em 2025, o prejuízo líquido foi de 345 milhões de yuans, 4,2 vezes o do ano anterior; mesmo excluindo fatores contabilísticos como incentivos de capital, o prejuízo ajustado foi de 187 milhões de yuans. As atividades operacionais geraram uma saída de caixa de 172 milhões de yuans no ano, o que significa uma queima média de cerca de 14,8 milhões de yuans por mês. Desde a sua fundação em agosto de 2023, o prejuízo acumulado em três anos é de cerca de 440 milhões de yuans.

Para uma fábrica normal, um aumento explosivo de encomendas é uma excelente notícia. Para uma fábrica com margem negativa, um aumento explosivo de encomendas significa apenas uma coisa: a velocidade a que se perde dinheiro também dispara.

Porque vale 7,74 mil milhões?

Ao ver isto, poderá perguntar-se: como é que um negócio que perde dinheiro conseguiu angariar sete rondas de financiamento em três anos, com uma avaliação a saltar de 280 milhões na ronda inicial para 7,74 mil milhões? Como é que a Alibaba, a Meituan, a Huawei Hubble, a SenseTime, a Zhipu AI e a Innovation Works estão todas na lista de acionistas?

Do ponto de vista do mercado de computação, a empresa ainda tem duas verdadeiras cartas na manga.

A primeira carta chama-se neutralidade. Uma das coisas que os programadores mais temem é amarrar todo o seu negócio à cloud de uma grande empresa, tornando a mudança futura muito cara. Uma plataforma de Tokens que não pertence a nenhum gigante é naturalmente tranquilizadora. O facto de o dinheiro dos gigantes aparecer simultaneamente na sua lista de acionistas mostra precisamente que todos precisam de uma zona intermédia que ninguém controla.

A segunda carta é a verdadeira narrativa vencedora: a subestação da capacidade de computação nacional.

A oferta limitada de chips da NVIDIA é uma realidade para toda a indústria de IA chinesa. Chips nacionais como Ascend, Muxi e Moore Threads estão a preencher a lacuna, mas cada um tem a sua própria arquitetura e características, tornando a entrada muito difícil para os programadores.

O que a SiliconFlow faz é unificar estes chips nacionais de naturezas díspares, traduzindo-os para Tokens padrão que todos podem usar. O facto de o DeepSeek completo poder funcionar sem problemas nos chips Ascend deve-se precisamente a esta capacidade de tradução.

Esta tarefa, as grandes empresas podem não estar dispostas a fazer pelos chips dos concorrentes, e os próprios fabricantes de chips não a fazem bem, mas todo o ecossistema nacional de capacidade de computação não pode viver sem ela. É como uma subestação na rede elétrica: a central a montante pode mudar, os consumidores a jusante podem mudar, mas a posição da subestação é a mais estável.

Em junho deste ano, a empresa comprou toda a propriedade intelectual da sua antiga casa, a OneFlow, reforçando precisamente esta camada. É também esta a base da sua coragem para avançar para a listagem ao abrigo do Capítulo 18C da Bolsa de Hong Kong (um canal especial para empresas tecnológicas não lucrativas): o prospeto cita a previsão da Frost & Sullivan de que o mercado chinês de fornecimento de Tokens cresceu 16 vezes de 2024 para 2025 e continuará a expandir-se a uma taxa anual de 638,3% nos próximos cinco anos.

Será que uma fábrica de Tokens é um bom negócio? O prospeto dá uma resposta dividida: vender Tokens padrão com base na diferença de preços é, atualmente, um negócio duro; ser a subestação da capacidade de computação nacional pode ser um negócio de época. A aposta da SiliconFlow é se consegue sobreviver com o tráfego do primeiro até obter os rendimentos do segundo.

Falhar repetidamente e lutar continuamente

Para perceber porque é que esta empresa ousa fazer esta aposta, temos de voltar a Yuan Jinhui.

Ao longo do seu percurso, quase cada passo foi "quase lá". Licenciatura na Universidade Eletrónica de Xi'an, em 2003 foi o primeiro do seu departamento de informática a entrar diretamente no doutoramento em Tsinghua, orientado pelo Académico Zhang Bo. Fez o doutoramento e pós-doutoramento, permanecendo no campus de Tsinghua quase uma década. O seu roteiro de vida original era ficar como professor, mas por ter escolhido a área interdisciplinar pouco popular da neurociência computacional, não conseguiu um cargo docente. Ficou a um passo da sala de aula, mas nunca chegou a subir ao estrado.

Quando saiu da torre de marfim, a época de ouro mais lucrativa da internet chinesa já tinha passado por ele. Passou pela NetEase Youdao, pela 360, e depois, no Microsoft Research Asia, desenvolveu um sistema central adotado por empresas como a Kuaishou, recebendo o Prémio Especial do Diretor.

Em 2017, saiu para empreender com uma convicção que quase ninguém acreditava na altura: os modelos futuros seriam tão grandes que as estruturas existentes não os comportariam, e o sistema subjacente teria de ser reescrito. Esta foi a OneFlow. A vaga posterior de grandes modelos provou que ele tinha apostado na direção certa, mas a empresa não conseguiu esperar pela época da colheita. Em 2023, foi vendida por 100 milhões de dólares à Guangnianzhiwai de Wang Huiwen, e meses depois, a Guangnianzhiwai foi totalmente integrada na Meituan.

Acertou no julgamento, sobreviveu, mas ainda assim não venceu. É isto que torna verdadeiramente doloroso o "comentário" no restaurante de bolinhos.

Naquela altura, Yuan Jinhui tinha ofertas de salários elevados de grandes empresas, e os membros da sua equipa tinham destinos dignos. A sua escolha foi partir com 35 dos 40 membros da equipa, pela terceira vez. Explicou publicamente a razão: numa grande empresa com negócios vastos, a prioridade de um framework de IA pode não ser muito alta; para esta equipa, porém, é a única coisa. A nova empresa chamou-se SiliconFlow, "Silicon" a referir-se aos chips, "Flow" ao software que faz a capacidade de computação fluir, ecoando a OneFlow, como se continuasse uma história inacabada. No WeChat Moments em que anunciou o recomeço do empreendedorismo, escreveu: "Os últimos 15 anos não foram fáceis, falhei repetidamente e lutei continuamente."

A indústria tecnológica chinesa nunca teve falta de pessoas que sabem contar histórias. O que é escasso é alguém que acertou na direção, perdeu o resultado final, e ainda assim está disposto a voltar à mesa de jogo. O prospeto da SiliconFlow não é bonito, mas por trás dele está um engenheiro que passou vinte anos a verificar repetidamente a mesma crença: a boa tecnologia merece sucesso comercial.

Independentemente da avaliação final do IPO no mercado, desejamos boa sorte à SiliconFlow e desejamos que Yuan Jinhui, desta vez, termine a história. Falhar repetidamente e lutar continuamente, por fim chegará a primavera.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado