Se você gosta de tecnologia e procura um trabalho que envolva ciência de dados, provavelmente já ouviu falar sobre aprendizado de máquina . O termo tem um ar de mistério em torno dele - muitas pessoas estão perplexas com o próprio conceito. No entanto, se você está procurando como se tornar um engenheiro de AI ou um desenvolvedor de business intelligence, provavelmente está bastante familiarizado com o aprendizado de máquina e tudo o que o rodeia. Se você realmente quiser conseguir um trabalho para atuar nessa área de machine learning, terá que se preparar para uma entrevista de emprego. E que melhor maneira de preparar do que revisar as perguntas e respostas sobre o aprendizado de máquina?
Neste tutorial, examinaremos algumas das perguntas mais populares sobre o machine learning. Nós vamos cobrir tanto o básico quanto o avançado, então vamos dar início ao nosso guia.
Tabela de Conteúdo
- 1. Introdução
- 1.1. Pergunta 1: O que é machine learning?
- 1.2. Pergunta 2: O que é 'deep learning'?
- 1.3. Pergunta 3: Qual é a diferença entre os erros 'tipo 1' e 'tipo 2'?
- 1.4. Pergunta 4: O que é 'data augmentation'?
- 1.5. Pergunta 5: Por que naive Bayes possui esse nome?
- 1.6. Pergunta 6: Quais são os melhores - redes profundas ou rasas?
- 1.7. Pergunta 7: O que é uma 'transformada de Fourier'?
- 1.8. Pergunta 8: O que é uma 'rede convolucional'?
- 1.9. Pergunta 9: O que devemos saber sobre a correlação entre 'True Positive Rate' e 'Recall'?
- 1.10. Pergunta 10: O que é uma 'retropropagação'?
- 1.11. Pergunta 11: O que acontece se usarmos apenas um 'conjunto de validação', sem aplicar um 'conjunto de testes'?
- 2. Perguntas avançadas sobre aprendizado de máquina
- 2.1. Pergunta 1: Qual é a diferença entre os modelos 'generativo' e 'discriminativo'?
- 2.2. Pergunta 2: Explique as diferenças entre 'validação cruzada' e 'validação cruzada estratificada'.
- 2.3. Pergunta 3: Em que situações você deve usar as regressões 'Lasso' e 'Ridge'?
- 2.4. Pergunta 4: O que é 'F1'?
- 2.5. Pergunta 5: Na maioria dos casos, qual dos dois tem uma pontuação mais alta - conjuntos ou modelos individuais?
- 2.6. Pergunta 6: Qual é a diferença entre 'correlação' e 'covariância'?
- 2.7. Pergunta 7: Descreva um 'conjunto de dados desequilibrado'.
- 2.8. Pergunta 8: O que é 'normalização de dados'?
- 2.9. Pergunta 9: Você pode capturar a correlação entre variáveis categóricas e contínuas?
- 2.10. Pergunta 10: Qual é o uso que damos à função de ativação?
- 3. Conclusões
Introdução
Uma vez que sua entrevista esteja agendada, você pode começar a se preparar e a estudar as perguntas de machine learning. A melhor maneira de fazer isso é começar a partir das perguntas básicas sobre aprendizado de máquina. Estes são os que você pode esperar receber no início de sua entrevista. Os empregadores querem ver se você é capaz de pensar criticamente e se pode formar seus próprios pensamentos coesos. É por isso que muitas dessas questões serão baseadas em definições, comparações, explicações e assim por diante.
Oferta Mais Recente Ativa Nesse Exato Momento:
SAVE 50%
DataCamp End of Year Sale
Unlock a year of unlimited data and AI learning at half the price! This is your final call to save big on expertise for 2025. Act fast and secure your 50% discount with DataCamp's End of Year Sale – the clock is ticking!
Pergunta 1: O que é machine learning?
Você realmente não esperava evitar essa pergunta, ou esperava?
A grande maioria de seus empregadores provavelmente irão perguntar algo semelhante logo de primeira. Isso é feito por alguns motivos.
Primeiro de tudo, seus entrevistadores não podem realmente prosseguir com outras perguntas gerais da entrevista antes de estabelecerem que você realmente tem uma idéia do que seja aprendizado de máquina . Além disso, a maneira como você responde mostrará o quão bem você pode pensar em suas próprias definições - ou, em outras palavras, quão bem você pode explicar um tópico difícil de uma maneira facilmente compreensível. Se você acabou de cuspir um roteiro de vinte páginas que você passou a noite inteira memorizando a partir de um diário científico aleatório, provavelmente isso lhe dará menos credibilidade do que se você pensasse em uma maneira de explicar isso sozinho.
Então… O que é machine learning?
Provavelmente, a maneira mais fácil e compreensível de descrever o aprendizado de máquina é chamá-lo de uma filosofia específica de desenvolvimento de IA . É um campo da ciência que se preocupa em como fazer máquinas que aprenderiam com as informações fornecidas a elas, sem serem programadas para isso de antemão.
Pergunta 2: O que é 'deep learning'?
Durante a sua entrevista você poderá receber uma ou outra pergunta relacionada ao Deep Learning, visto que machine learning e deep learning são intimamente interligados.
Deep Learning é um ramo da aprendizagem de máquina . Este ramo da ciência está preocupado em fazer as redes neurais da máquina se assemelharem ao cérebro humano o mais próximo possível.
Pergunta 3: Qual é a diferença entre os erros 'tipo 1' e 'tipo 2'?
Erros tipo 1 afirmam que algo aconteceu quando, na verdade, era impossível que isso acontecesse. Os erros do tipo 2 fazem o oposto - afirmam que nada aconteceu quando isso aconteceu claramente.
Tais perguntas de entrevista sobre aprendizado de máquina podem ficar um pouco confusas, mas existem alguns métodos que você pode utilizar para tornar mais fácil de lembrar.
Por exemplo, aqui está um bom método para ajudá-lo a lembrar a diferença entre os dois tipos de erros: imagine que um erro tipo 1 é quando você diz ao seu cão que ele é um gato, enquanto um erro tipo 2 é quando você diz ao mesmo cão que os cães não podem latir.
Pergunta 4: O que é 'data augmentation'?
Uma das questões mais simples de entrevista sobre o aprendizado de máquina, o data augmentation é uma maneira de modificar e criar novos dados fora do antigo . A maneira como isso é feito é deixar o alvo como está ou simplesmente mudá-lo para algo que já é conhecido.
Pergunta 5: Por que naive Bayes possui esse nome?
Naive Bayes é chamado assim por causa da maneira que pensa. Faz a suposição de que cada elemento em um conjunto de dados é o mesmo quando se trata de sua importância. Escusado será dizer que quase nunca é o caso no cenário do dia-a-dia.
Pergunta 6: Quais são os melhores - redes profundas ou rasas?
Você poderia classificar isso como uma das questões de comparação, pois você tem que saber um pouco sobre ambas as redes e também ser capaz de compará-las para encontrar a clara diferença.
Redes profundas são geralmente consideradas a melhor alternativa. Isto se dá simplesmente porque eles são compostos de mais camadas, a maioria das quais estão escondidas - isso ajuda a redes profundas a extrair e construir melhores recursos.
Pergunta 7: O que é uma 'transformada de Fourier'?
O método 'Transformada de Fourier' é usado para transformar funções simples e genéricas no que é conhecido como super-funções . Se esta é uma das perguntas que você gostaria de expandir um pouco mais, você pode compará-la com uma situação em que você é dado um carro para desmontá-lo e ver todos os diferentes componentes e peças que o carro é feito.
Pergunta 8: O que é uma 'rede convolucional'?
Redes normais e simples usam camadas conectadas para executar seus processos. Por sua vez, as redes convolucionais são aquelas que, em vez de usar camadas conectadas, usam as convolucionais .
A principal razão pela qual as pessoas preferem usar redes de convolução em relação às redes padrão e de camada conectada é que as redes convolucionais têm uma quantidade muito menor de parâmetros atribuídos a elas.
Pergunta 9: O que devemos saber sobre a correlação entre 'True Positive Rate' e 'Recall'?
Embora isso pareça uma das perguntas mais avançadas de uma entrevista sobre aprendizado de máquina, a resposta é realmente muito simples. Ambas as métricas são idênticas. Podemos ver isso olhando sua fórmula: TP / TP + FN.
Pergunta 10: O que é uma 'retropropagação'?
Um termo chocante em si mesmo, a retropropagação é simplesmente um método de treinamento para redes neurais de múltiplas camadas . Nós treinávamos a rede com esse método pegando o ' erro ' do final e colocando-o dentro de cada peso dentro da rede. Desta forma, a máquina tem a oportunidade de aplicar sua computação de forma mais eficaz.
Pergunta 11: O que acontece se usarmos apenas um 'conjunto de validação', sem aplicar um 'conjunto de testes'?
Como é apropriado para a última das perguntas básicas de uma entrevista sobre aprendizado de máquina, esta pode parecer mais difícil.
Basicamente, se você aplicasse apenas um conjunto de validação, ele não forneceria uma estimativa precisa de todas as medidas do modelo que você está tentando testar. Isso ocorre porque o ' conjunto de testes ' é usado para testar como o modelo seria executado em exemplos que ele não encontrou até aquele momento. Assim, se você remover o conjunto de testes, você automaticamente irá enfraquecer os resultados de testes possivelmente válidos, por assim dizer.
Perguntas avançadas sobre aprendizado de máquina
Agora que você tem uma idéia do que é machine learning em geral podemos passar para as coisas mais avançadas.
Não se deixe enganar, no entanto. Seus empregadores provavelmente não pedirão para você construir um sistema de IA auto-suficiente ou escrever um livro de trezentas páginas sobre todas as diferentes maneiras de estudar o deep learning. Neste contexto, “avançado” significa simplesmente que as perguntas vão ser um pouco mais difíceis - você pode ser solicitado a fornecer mais explicações para suas respostas, dar exemplos, etc. Então, não se preocupe, relaxe e vamos seguir em frente.
Pergunta 1: Qual é a diferença entre os modelos 'generativo' e 'discriminativo'?
Embora possa parecer uma das perguntas mais difíceis de uma entrevista sobre aprendizagem de máquina, seus empregadores provavelmente só querem saber como esses modelos lidam com os dados.
Um modelo generativo , como o nome indica, vai colocar o esforço e aprender as diferentes categorias de dados que são fornecidos. Em oposição, um modelo discriminativo apenas estudará as diferenças entre as várias categorias de dados.
Desenvolvedores e engenheiros geralmente preferem usar o modelo discriminativo, pois ele tende a lidar com suas tarefas mais rapidamente e de maneira mais eficiente.
Pergunta 2: Explique as diferenças entre 'validação cruzada' e 'validação cruzada estratificada'.
A validação cruzada simples é usada para separar dados aleatoriamente entre o período de treinamento e o conjunto de validação. A validação cruzada estratificada faz exatamente o mesmo, mas sem a variável aleatória - ela monitora e preserva o rácio de treinamento versus o teste de validação. Esta é uma daquelas perguntas sobre aprendizagem de máquina que podem ser fáceis de nos confundir, então esteja atento!
Pergunta 3: Em que situações você deve usar as regressões 'Lasso' e 'Ridge'?
Para responder a esta pergunta você precisa de um conhecimento profundo sobre os dois tipos de regressão para fornecer uma resposta válida.
A regressão Lasso pode executar ambas as funções de seleção de variáveis e parâmetros de encolhimento, enquanto uma regressão Ridge só pode ser usada para o último. Seguindo esta linha de raciocínio, você provavelmente usaria a regressão Lasso quando tiver apenas algumas variáveis e um grande efeito. Por sua vez, uma regressão Ridge deve ser usada quando há muitas variáveis pequenas.
Pergunta 4: O que é 'F1'?
Não, isso não tem nada a ver com o seu teclado.
A pontuação F1 é uma medida de quão bem o seu modelo está operando. Qualquer coisa perto da marca ' 1 ' é ótima, qualquer coisa abaixo da marca ' 0,5 ' deve ser trabalhada.
Pergunta 5: Na maioria dos casos, qual dos dois tem uma pontuação mais alta - conjuntos ou modelos individuais?
Conjuntos são geralmente aqueles que fornecem uma pontuação maior. Isso acontece porque são simplesmente combinações de vários modelos diferentes, feitos para prever um resultado específico. Quanto mais modelos houver, mais erros eles poderão classificar - melhor será a pontuação da previsão final.
Pergunta 6: Qual é a diferença entre 'correlação' e 'covariância'?
A resposta é bem simples: a covariância se torna correlação quando ela se torna padronizada .
Pergunta 7: Descreva um 'conjunto de dados desequilibrado'.
Um conjunto de dados desequilibrado é um conjunto que, após o teste, traz de volta os resultados de que mais da metade de toda a informação está estacionada em apenas uma classe.
Como você pode evitar isso? Bem, existem algumas soluções simples - execute o teste novamente usando um algoritmo diferente ou tente testar uma quantidade ainda maior de dados para que os resultados sejam uniformes.
Pergunta 8: O que é 'normalização de dados'?
Lembra-se de quando falamos sobre ' retropropagação '? Bem, a normalização de dados é usada para minimizar a redundância de dados dentro do processo de retropropagação. Ela permite que o usuário redimensione os valores diferentes da maneira que julgar adequada, eliminando possíveis problemas de redundância.
Pergunta 9: Você pode capturar a correlação entre variáveis categóricas e contínuas?
Bem, poder você pode, mas para isso você tem que usar o que é conhecido como o método Análise de Covariância ( ANCOVA ). Usando isso, você pode capturar a tal correlação.
- Fácil de usar
- Oferece conteúdo de qualidade
- Muito transparente com os preços
- Design simples (sem informações desnecessárias)
- Cursos de alta qualidade (mesmo os gratuitos)
- Variedade de recursos
- Programas Nanodegree
- Indicado para empresas
- Certificados de conclusão pagos
- Bem estabelecido na indústria
- Grande extensão de funcionalidades para escolher
- Cursos de nível superior
- Cursos de nível superior
- Indicado para empresas
- Certificados Pagos de conclusão
Pergunta 10: Qual é o uso que damos à função de ativação?
Esta função permite diversificar a sua rede, introduzindo métodos não lineares de aprendizagem. O que isso fará é ajudar a sua máquina a aprender como processar processos (passe à expressão) difíceis de maneira mais fácil.
Você sabia?
Você já se perguntou quais plataformas de aprendizagem online são as melhores para sua carreira?
Conclusões
Neste tutorial, analisamos as perguntas de entrevista sobre aprendizado de máquina. Começamos com o básico e, mais tarde, cobrimos algumas das perguntas e respostas mais avançadas sobre machine learning que você pode receber durante sua entrevista de emprego.
Não importa se você está procurando um emprego como especialista em TI ou especialista em IA de aprendizagem de máquina, faça o melhor para revisar e lembrar essas perguntas e respostas. Claro, nós apenas tocamos a ponta do iceberg, mas se você aprender estas questões e suas respostas de cor, você deve pelo menos desenvolver uma idéia geral do que você pode esperar da entrevista.
Então, chegamos ao final deste tutorial de perguntas de machine learning. Espero que as informações sejam úteis para você adquirir o seu tão sonhado emprego nesta área. Boa sorte!