Questão 13
Uma organização criou recentemente um modelo personalizado que se integra a um modelo de linguagem (LLM). O desenvolvedor percebe que os custos da interface de programação de aplicativos (API) aumentaram. Qual das alternativas a seguir é o melhor controle para reduzir custos?
- A Implementando modelos de prompt
- B Aumentar a unidade central de processamento (CPU) e a memória
- C Reduzindo o tamanho do modelo
- D Ajustando limites de token
Resposta correta:
D
Explicação
Explicação: Conceito Básico: O preço da API LLM é baseado principalmente no consumo de tokens – o número de tokens processados em prompts de entrada e respostas de saída. Controlar o uso de tokens é a alavanca mais direta para gerenciar e reduzir custos de API LLM. O Guia de estudo CompTIA SecAI+ cobre o gerenciamento de custos de IA e controles de recursos na segurança de sistemas de IA. Por que D está correto: O ajuste dos limites de token limita diretamente o número máximo de tokens usados por solicitação para entrada e saída. Ao definir limites de tokens apropriados, a organização evita que prompts excessivamente longos ou respostas detalhadas consumam tokens desnecessários, o que se traduz diretamente em custos de API mais baixos e fornece controle rígido do orçamento. Por que A está errado: os modelos de prompt padronizam a forma como as consultas são estruturadas, o que pode melhorar indiretamente a eficiência. No entanto, eles não impõem um limite rígido ao uso de tokens e não podem impedir que os custos aumentem com grandes volumes ou respostas detalhadas. Por que B está errado: O aumento da CPU e da memória aborda o desempenho da infraestrutura computacional no lado do cliente. Os custos da API LLM são cobrados pelo provedor de API com base no uso do token, não nos recursos de hardware do cliente. Por que C está errado: Reduzir o tamanho do modelo significa usar uma versão de modelo menor e menos potente. Embora isto possa reduzir o custo por token, é uma decisão de seleção de modelo, e não um controle operacional contínuo que pode ser ajustado para gerenciar custos em tempo real.