Então, aqui está o que eles lançaram: cinco níveis, basicamente. O nível Priority é aquele que chamou a minha atenção primeiro - custa entre 75% a 100% mais do que as tarifas padrão, mas oferece tempos de resposta de milissegundos a segundos. Esse é o nível para tarefas críticas, bots de atendimento ao cliente que não podem tolerar atrasos, sistemas de deteção de fraude onde a velocidade é importante. Faz sentido.

Depois, temos o extremo oposto. Os níveis Flexible e Batch custam metade do preço. Flexible é para aplicações que não se preocupam com latência, Batch trata de trabalhos pesados de processamento de dados. Se estás a fazer operações em massa ou cargas de trabalho não sensíveis ao tempo, esse desconto de 50% é bastante significativo.

O que é interessante na estrutura de preços da API Gemini do Google é o nível Cache - é projetado para cenários de instruções complexas de alta frequência. Estás a pagar com base no número de tokens e na duração do armazenamento, o que é um modelo diferente dos outros. Está otimizado para situações em que estás a fazer chamadas repetidas à API com prompts semelhantes.

Tudo isto parece indicar que o Google está a tentar resolver um problema real. Nem toda aplicação precisa da mesma coisa, certo? Algumas precisam de velocidade, outras de volume, outras de eficiência de custos. Ao oferecer esses níveis de serviço distintos, eles estão basicamente a dizer "escolha o que realmente se encaixa no seu caso de uso", em vez de pagar por funcionalidades premium que não precisa.

Do ponto de vista de mercado, este tipo de preços flexíveis para serviços de API está a tornar-se uma condição básica. Os desenvolvedores estão a ficar mais inteligentes quanto aos custos de infraestrutura, e plataformas que permitem otimizar de acordo com as suas necessidades reais tendem a ganhar adoção. Vale a pena acompanhar como isto se desenrola no espaço mais amplo dos serviços de inferência de IA.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

Recompensa
gostar
Comentar
Republicar
Partilhar

Comentar

Adicionar um comentário

Nenhum comentário

Tópicos em destaque
Ver mais
#
Gate13thAnniversaryLive
1.16M Popularidade
#
WCTCTradingChallengeShare8MUSDT
779.85K Popularidade
#
BitcoinBouncesBack
200.85K Popularidade
#
IsraelStrikesIranBTCPlunges
30.62K Popularidade
#
USIranTalksProgress
785.95K Popularidade

Fixar

Tópicos em destaque

Gate13thAnniversaryLive

WCTCTradingChallengeShare8MUSDT

BitcoinBouncesBack

IsraelStrikesIranBTCPlunges

USIranTalksProgress

Fixar