Questão 4
Um fabricante de automóveis implementa um chatbot para auxiliar nas opções de configuração dos automóveis dos clientes. Atendendo à solicitação do cliente, o chatbot dá respostas ofensivas. Qual das alternativas a seguir descreve esse comportamento?
- A Inclinação do modelo
- B Roubo de modelo
- C Jailbreaking
- D Manipulação de saída insegura
Resposta correta:
C
Explicação
Explicação: Conceito Básico: Os chatbots de IA são projetados com diretrizes de segurança e políticas de conteúdo que os impedem de gerar conteúdo prejudicial, ofensivo ou impróprio. Quando os usuários encontram maneiras de contornar essas restrições por meio de prompts elaborados, eles "desbloqueiam" o modelo. O Guia de Estudo CompTIA SecAI+ cobre o jailbreak como uma categoria chave de vulnerabilidade de IA. Por que C está correto: Jailbreaking é o processo de usar prompts habilmente elaborados para contornar as restrições de segurança, políticas de conteúdo e proteções comportamentais integradas de um modelo de IA, fazendo com que ele produza resultados que foi projetado para recusar. O cenário descreve um chatbot que foi projetado para assistência na configuração de automóveis, mas que está produzindo respostas ofensivas após as solicitações dos clientes, indicando que os clientes conseguiram fazer com que o modelo contornasse suas restrições de segurança e gerasse conteúdo proibido. Por que A está errado: A distorção do modelo refere-se a ataques ou preconceitos que fazem com que um modelo favoreça sistematicamente determinados resultados ou perspectivas ao longo do tempo, muitas vezes através da manipulação de dados. Ele descreve uma distorção gradual do comportamento do modelo, não um desvio direto das restrições de segurança solicitado pelo usuário em uma única interação. Por que B está errado: O roubo de modelo envolve extrair ou replicar a funcionalidade ou arquitetura de um modelo proprietário por meio de consultas repetidas. É um ataque à propriedade intelectual que visa roubar o conhecimento do modelo, e não um ataque que faz com que o modelo produza conteúdo ofensivo. Por que D está errado: O tratamento inseguro de saída ocorre quando um aplicativo não consegue validar ou higienizar adequadamente as saídas geradas por IA antes de usá-las de maneiras que possam causar danos, como passar a saída de IA diretamente para um comando do sistema ou consulta de banco de dados. Ele descreve uma vulnerabilidade de implementação do desenvolvedor, não o ato de um usuário solicitar que um modelo contorne suas restrições de segurança.