Sempre que é necessário tomar uma decisão, precisamos levar em consideração vários fatores que, em geral, não possuem a mesma importância ou influência. Uma das principais utilidades da análise multivariada é exatamente a identificação desses fatores e das relações entre eles para se obter uma imagem melhor e mais completa do ambiente.

Mas o que é Análise Multivariada?

A análise multivariada consiste em um conjunto de métodos estatísticos utilizados em situações em que várias variáveis são medidas simultaneamente em cada elemento amostral.

Na maioria das vezes, as variáveis são correlacionadas entre si e quanto maior o número de variáveis, mais complexa torna-se a análise por métodos comuns.

Em geral, os métodos de análise multivariada são utilizados com o propósito de simplificar ou facilitar a interpretação do fenômeno que está sendo estudado.

Basicamente, a análise multivariada se divide em dois grupos: um primeiro consistindo em técnicas exploratórias de simplificação da estrutura de variabilidade dos dados, em uma tentativa de sintetizar as variáveis, e um segundo, consistindo em técnicas de inferência.

Métodos de Análise Multivariada

A seguir apresentaremos uma síntese de alguns dos métodos de análise multivariada mais utilizados:

  • Análise de correspondência
  • Análise de componentes principais
  • Análise fatorial
  • Análise de cluster
  • Análise de regressão múltipla
  • Modelagem de equações estruturais

Análise de Correspondência

A análise de correspondência é uma técnica de análise multivariada que tem como objetivo básico verificar a associação entre variáveis categóricas gerando tabelas de contingência.

Testes como o qui-quadrado, por exemplo, são utilizados para avaliar se a informação contida nas linhas da tabela é independente, ou não, da informação contida nas colunas.

Como exemplo prático de aplicação, temos que um pesquisador quer explorar como diferentes categorias de acidentes de automóvel se relacionam umas às outras. Os acidentes de automóvel são classificados de acordo com o tipo, gravidade, tamanho do carro e ejeção do motorista.

É realizada então, uma análise de correspondência para examinar como as categorias na tabela de quatro fatores se relacionam umas às outras.

Análise de Componentes Principais

A análise de componentes principais, também conhecida como PCA (do inglês Principal Component Analysis), é um método de análise multivariada que tem por finalidade básica a análise dos dados de forma reduzida, eliminando as sobreposições e escolhendo a forma mais representativa dos dados a partir de combinações lineares das variáveis originais.

Para exemplificar, temos que um banco exige oito informações de candidatos a empréstimos: renda, grau de instrução, idade, tempo na residência atual, tempo no emprego atual, poupança, dívidas e número de cartões de crédito. Um administrador bancário deseja analisar esses dados para determinar a melhor maneira de agrupá-los e relatá-los.

Dessa forma, a análise de componentes principais é realizada para reduzir o número de variáveis para tornar os dados mais fáceis de analisar, escolhendo um número de componentes que explique boa porcentagem da variação dos dados.

Análise Fatorial

Da mesma forma, a análise fatorial tem como objetivo principal descrever a variabilidade original de um conjunto de variáveis em um número reduzido de variáveis latentes.

É uma técnica muito utilizada na criação de indicadores.

Um gerente de recursos humanos, por exemplo, quer determinar quais fatores explicam as 12 variáveis que o departamento de recursos humanos mede para cada candidato a um emprego. Os funcionários classificam cada candidato com base em diversas características usando uma escala de 1 (baixo) a 10 (alto).  

A análise fatorial é responsável por determinar quantos fatores respondem pela maior parte do total da variabilidade nos dados.

Análise de Cluster

A análise de cluster, também conhecida como análise de conglomerados, classificação ou agrupamento, é uma técnica de análise multivariada que tem como propósito agrupar os elementos selecionados em grupos com características similares entre si de maneira que os elementos em grupos diferentes sejam heterogêneos em relação a estas mesmas características.

Várias são as situações na qual a análise de cluster se faz presente.

Em psicologia, por exemplo, é utilizada na classificação de pessoas de acordo com seus perfis de personalidade; em pesquisa de mercado, na identificação do posicionamento de produtos em relação aos concorrentes de mercado; em geografia, na classificação de cidades, estados ou regiões de acordo com variáveis físicas, demográficas e econômicas entre outras áreas.

Análise de Regressão Multivariada

A regressão multivariada é uma coleção de técnicas estatísticas que constroem modelos que descrevam de maneira razoável relações entre várias variáveis explicativas de um determinado processo.

A diferença entre a regressão linear simples e a multivariada é que nesta são tratadas duas ou mais variáveis explicativas.

Pensa-se que a energia elétrica consumida mensalmente na produção de um determinado produto químico está relacionada com a temperatura média ambiental, o número de dias do mês, a pureza média do produto e o número de toneladas de produto produzidas. Utiliza-se da regressão multivariada para verificar essas influências, de forma instantânea.

Modelagem de Equações Estruturais

A modelagem de equações estruturais, denominada SEM (do inglês Structural Equation Modeling), é um método de análise multivariada que combina aspectos de regressão múltipla e de análise fatorial, com o objetivo de estimar simultaneamente uma série de relações de dependência.

Como exemplo prático, temos que um pesquisador deseja avaliar várias relações de dependência de forma instantânea entre variáveis latentes (variáveis que sintetizam a informação de várias outras variáveis).

A modelagem de equações estruturais realiza o processo de sintetização dos dados e estima os parâmetros das relações de dependência.

Se interessou por Análise Multivariada e os resultados obtidos ao utilizar esta técnica?  Não deixe de se registrar em nosso Blog, para acompanhar nossas publicações e caso tenha alguma dúvida, entre em contato com nossos Data Talkers.

* Artigo desenvolvido com a colaboração de Luiz Henrique Marques Carvalho.

0 respostas

Deixe uma resposta

Quer participar dessa discussão?
Sinta-se livre para contribuir!

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *