A data scientist is working with unlabeled data and wants to build a clustering model. Which of the following techniques should a data scientist use?

C Explanation: Basic Concept: Different ML learning paradigms handle different data situations. The availability of labeled versus unlabeled data determines which learning approach is appropriate. Building clustering models specifically requires learning from data without predefined category labels. CompTIA SecAI+ Study Guide covers ML learning paradigms under basic AI concepts. Why C is Correct: Unsupervised learning works with unlabeled data by discovering inherent patterns, structures, and groupings within the data without predefined categories. Clustering is the canonical unsupervised learning task, where algorithms like k-means, hierarchical clustering, or DBSCAN group similar data points together based on feature similarity. Since the data scientist has unlabeled data and wants to find natural groupings, unsupervised learning is the appropriate and correct technique. Why A is Wrong: Supervised learning requires labeled training data where each example has a corresponding correct output label. The data scientist explicitly has unlabeled data, making supervised learning inapplicable without first completing the labor-intensive task of manually labeling all examples. Why B is Wrong: Reinforcement learning trains agents to take actions in an environment to maximize cumulative rewards through trial and error. It is designed for sequential decision-making problems, not for finding groupings in static, unlabeled datasets. Why D is Wrong: Semi-supervised learning combines a small amount of labeled data with a large amount of unlabeled data. It requires at least some labels to guide learning. The scenario specifies working with unlabeled data only, making unsupervised learning the pure fit.

SK0-005 CompTIA Server+ Simulado Online Grátis

Questão 2

Um cientista de dados está trabalhando com dados não rotulados e deseja construir um modelo de clustering. Qual das seguintes técnicas um cientista de dados deve usar?

A Aprendizagem supervisionada
B Aprendizagem por reforço
C Aprendizagem não supervisionada
D Aprendizagem semissupervisionada

Resposta correta: C

Explicação

Explicação: Conceito Básico: Diferentes paradigmas de aprendizagem de ML lidam com diferentes situações de dados. A disponibilidade de dados rotulados e não rotulados determina qual abordagem de aprendizagem é apropriada. A construção de modelos de clustering requer especificamente o aprendizado com dados sem rótulos de categoria predefinidos. O Guia de estudo CompTIA SecAI + cobre paradigmas de aprendizagem de ML sob conceitos básicos de IA. Por que C está correto: o aprendizado não supervisionado funciona com dados não rotulados, descobrindo padrões, estruturas e agrupamentos inerentes aos dados sem categorias predefinidas. Clustering é a tarefa canônica de aprendizagem não supervisionada, onde algoritmos como k-means, clustering hierárquico ou DBSCAN agrupam pontos de dados semelhantes com base na similaridade de recursos. Como o cientista de dados possui dados não rotulados e deseja encontrar agrupamentos naturais, o aprendizado não supervisionado é a técnica apropriada e correta. Por que A está errado: o aprendizado supervisionado requer dados de treinamento rotulados, onde cada exemplo possui um rótulo de saída correto correspondente. O cientista de dados possui explicitamente dados não rotulados, tornando o aprendizado supervisionado inaplicável sem primeiro concluir a trabalhosa tarefa de rotular manualmente todos os exemplos. Por que B está errado: O aprendizado por reforço treina os agentes para realizar ações em um ambiente para maximizar recompensas cumulativas por meio de tentativa e erro. Ele foi projetado para problemas de tomada de decisão sequencial, não para encontrar agrupamentos em conjuntos de dados estáticos e não rotulados. Por que D está errado: o aprendizado semissupervisionado combina uma pequena quantidade de dados rotulados com uma grande quantidade de dados não rotulados. Requer pelo menos alguns rótulos para orientar o aprendizado. O cenário especifica o trabalho apenas com dados não rotulados, tornando o aprendizado não supervisionado o ajuste perfeito.

Questão 1

Voltar à amostra

Questão 3

Questão 2

Explicação

Are you sure ?