Questão 6

Um cientista de dados investiga relatos de que um modelo de machine learning (ML) de produção não funciona mais com precisão. O cientista de dados encontra as seguintes entradas de log do pipeline: Qual das seguintes opções a equipe de segurança deve fazer para mitigar ocorrências futuras?
  1. A Adicione ferramentas de verificação de código estático ao trabalho do executor.
  2. B Ative fluxos de trabalho de revisão e aprovação humana no repositório.
  3. C Retreine o modelo no uso de dados e épocas aumentados.
  4. D Mantenha várias cópias do modelo para restauração.
Resposta correta: B

Explicação

Explicação: Conceito básico: quando alterações não autorizadas em um pipeline de treinamento de ML causam degradação do modelo, a causa raiz é controle de acesso e gerenciamento de alterações insuficientes em todo o pipeline. A prevenção de ocorrências futuras requer a implementação de controles de governança que garantam que todas as alterações no pipeline sejam revisadas e aprovadas antes da execução. O Guia de Estudo CompTIA SecAI+ cobre os controles de gerenciamento de mudanças MDLC. Por que B está correto: habilitar fluxos de trabalho de revisão e aprovação humana no repositório cria uma porta obrigatória que exige que revisores autorizados examinem e aprovem quaisquer alterações no código do pipeline de treinamento antes que possam ser mescladas e executadas. Isso evita que modificações não autorizadas cheguem ao pipeline, aplicando um processo de revisão onde quaisquer alterações suspeitas ou não autorizadas serão detectadas e rejeitadas antes que afetem o treinamento e o desempenho do modelo. Por que A está errado: a verificação estática de código analisa o código em busca de vulnerabilidades e violações dos padrões de codificação. Embora melhore a qualidade e a segurança do código, não impede que indivíduos não autorizados enviem e mesclem alterações maliciosas no pipeline sem a devida revisão. Por que C está errado: O retreinamento com mais dados e épocas aborda a restauração do desempenho do modelo após o fato, mas não evita futuras modificações não autorizadas no pipeline. Se o pipeline permanecer desprotegido, o mesmo ataque poderá ocorrer novamente no novo modelo. Por que D está errado: manter várias cópias de modelo permite a restauração rápida de uma versão anterior quando um modelo implantado está comprometido. Embora útil para recuperação, é uma medida reativa que não impede que alterações não autorizadas no pipeline ocorram e afetem o treinamento futuro do modelo.