O popular programa Excel da Microsoft possui recursos de análise de dados que incluem a realização de análises de regressão com variáveis fictícias. Variáveis dummy são variáveis categóricas expressas numericamente como 1 ou 0 para indicar a presença ou ausência de uma determinada qualidade ou característica. O Excel não requer nenhuma função especial quando um modelo de regressão inclui uma variável fictícia entre as variáveis independentes. No entanto, modelos de regressão com variáveis fictícias dependentes requerem add-ins adicionais, programas que expandem as opções e recursos do Excel.
Regressão com variáveis fictícias usando o Excel
Etapa 1
Carregue a ferramenta de análise de dados dos suplementos do Excel, incluídos em todas as versões do Excel. Você deve fazer isso para conduzir uma regressão ou qualquer outro tipo de análise de dados. Clicar em "Ferramentas" abre um menu drop-down. Selecione “Add-ins” e no menu que se abre, marque “Analysis ToolPak” e clique em “OK”. "Análise de dados" deve aparecer no menu Ferramentas.
Etapa 2
Insira os dados que você usará para sua regressão em uma planilha do Excel, codificando quaisquer variáveis fictícias com o valor 1 ou 0, dependendo se o sujeito possui a característica em questão. O gênero é um exemplo de variável dummy, pois os sujeitos de um estudo podem ser apenas homens ou mulheres. Um estudo de notas de vestibulares que incluíssem o sexo dos sujeitos, por exemplo, poderia codificar estudantes do sexo feminino com 1. O uso de variáveis fictícias entre suas variáveis independentes não requer funções especiais no Excel. Lembre-se de que se uma variável fictícia tiver apenas duas categorias (como masculino ou feminino), apenas uma variável será necessária para representar as duas categorias.
Etapa 3
Codifique variáveis categóricas com mais de duas categorias como variáveis dummy múltiplas, certificando-se de que o número de variáveis seja um a menos que o número de categorias (n-1, em termos estatísticos). Por exemplo, a categoria etnia expressa em cinco níveis (branco, negro, hispânico, asiático, índio americano) exigiria quatro variáveis fictícias separadas. Por exemplo, se você estivesse estudando as notas do vestibular, você poderia criar as seguintes variáveis fictícias:negro, hispânico, asiático e índio americano, codificando cada um 1 se o aluno em questão se encaixar nessa categoria étnica.
Etapa 4
Expanda a capacidade de regressão do Excel com variáveis fictícias com um add-in que permitirá ao programa realizar regressões com variáveis dependentes fictícias. Um desses programas é o XLStat, disponível para compra e download do fabricante, Addinsoft. Programas como este permitem que você conduza regressões nas quais a variável dependente assume os valores ou 1 ou 0.
Aviso
Um erro comum entre os iniciantes é usar tantas variáveis fictícias quantas forem as categorias (como, por exemplo, duas variáveis fictícias para masculino e feminino). Tal abordagem criaria multicolinearidade, na qual duas variáveis independentes são altamente correlacionadas, tornando quase impossível determinar seus efeitos separados na variável dependente. Lembre-se de que o número de variáveis fictícias deve sempre ser um a menos que o número de categorias.