View
215
Download
0
Category
Preview:
Citation preview
O USO DE TÉCNICAS QUANTITATIVAS EM CRM: uma aplicação no varejo
brasileiro.
João Marcelo Leal Gomes Leite
Universidade Federal do Rio de Janeiro
Instituto COPPEAD de Administração
Mestre em Administração
Orientador: Eduardo Saliby, Ph.D.
Rio de Janeiro, RJ - Brasil
2001
ii
O USO DE TÉCNICAS QUANTITATIVAS EM CRM: uma aplicação
no varejo brasileiro.
João Marcelo Leal Gomes Leite
Dissertação submetida ao corpo docente do Instituto de Pós-Graduação e
Pesquisa em Administração da Universidade Federal do Rio de Janeiro –
COPPEAD/UFRJ, como parte dos requisitos necessários à obtenção do grau
de Mestre em Ciências em Administração.
Aprovada por:
Prof. ______________________________________ - Orientador
Eduardo Saliby - Ph.D. University of Lancaster
Prof. ______________________________________
Letícia Moreira Casotti - D.Sc. UFRJ
Prof. ______________________________________
Monica Barros - D.Sc. PUC-Rio
Rio de Janeiro
Dezembro/2001
iii
Leite, João Marcelo Leal Gomes.
O uso de técnicas quantitativas em CRM: uma
aplicação no varejo brasileiro/ João Marcelo Leal Gomes
Leite. Rio de Janeiro: UFRJ/COPPEAD, 2001.
xvii, 148 p. ; il.
Dissertação (Mestrado) – Universidade Federal do Rio
de Janeiro, COPPEAD, 2001. Orientador: Eduardo Saliby.
1. CRM. 2. Relacionamento com clientes. 3. Tese
(Mestr. UFRJ/COPPEAD). 4. Saliby, Eduardo, orient. I.
Título.
iv
DEDICATÓRIA
À minha família, principalmente meu pai, minha mãe, minha irmã, minha
madrinha, minha avó e minha Ná. Por estarem sempre ao meu lado nestes
anos todos de estudo.
À COPPEAD (professores e funcionários), por me proporcionarem estes dois
anos de conhecimento.
Ao meu orientador e amigo, Eduardo Saliby, por esta dissertação e por tudo
o que fez por mim.
À minha banca, Letícia e Monica, pela disponibilidade e paciência.
v
RESUMO
LEITE, João Marcelo Leal Gomes. O uso de técnicas quantitativas em CRM:
uma aplicação no varejo brasileiro.. Orientador: Eduardo Saliby. Rio de Janeiro:
UFRJ/COPPEAD; 2001. Dissertação (Mestrado em Administração).
Com o advento do CRM (Customer Relationship Management) muitas
empresas passaram a compreender a importância da construção de um
relacionamento com os seus clientes e começaram uma busca desenfreada
por informações sobre eles. Entretanto, a extração do conhecimento muitas
vezes parece uma tarefa difícil, quase impossível. Esta dissertação tem por
objetivo ressaltar a importância do CRM e mostrar que a obtenção de
informações sobre os clientes é uma tarefa mais simples do que aparenta.
Utilizando o exemplo de uma rede de hipermercados, mostra-se que, com a
construção de um banco de dados com as compras dos clientes e a utilização
de técnicas estatísticas simples, é possível extrair bastante conhecimento
relevante sobre os clientes. Este conhecimento estimula ainda mais a obtenção
de novas informações, mas já é o suficiente para, se for bem aplicado, trazer
uma importante vantagem competitiva para a empresa neste mundo tão
competitivo.
vi
ABSTRACT
LEITE, João Marcelo Leal Gomes. O uso de técnicas quantitativas em CRM:
uma aplicação no varejo brasileiro.. Orientador: Eduardo Saliby. Rio de Janeiro:
UFRJ/COPPEAD; 2001. Dissertação (Mestrado em Administração).
With the coming of CRM (Customer Relationship Management) a lot of
companies started to understand the importance of the construction of a
relationship with their clients and they began a wild search for information on
them. However, the exploration of the knowledge many times it seems a task
difficult, almost impossible. This dissertation has for objective to emphasize the
importance of CRM and to show that the obtaining of information on the clients
is a simpler task than it looks. Using the example of a hypermarket company, it
is shown that, with the construction of a database system with the clie nts'
purchases and the use of simple statistical techniques, it is possible to extract
plenty relevant knowledge on the clients. This knowledge still stimulates more
the obtaining of new information, but it is already enough for, if it goes very
applied, to bring an important competitive advantage for the company in such
competitive world.
vii
LISTA DE FIGURAS
Figura 1 Processo de extração de conhecimento .......................................... 41
Figura 2 Visão holística do processo data mining .......................................... 41
Figura 3 Arquitetura do data warehouse .......................................................... 47
Figura 4 Mapeamento das classes segundo a SOM (branco para
compradores, preto para não compradores e tons de cinza para
classes não bem definidas) ................................................................ 60
Figura 5 Posicionamento dos 5 super-clusters no mapa da SOM............... 62
viii
LISTA DE GRÁFICOS
Gráfico 1 Percentual acumulativo dos clientes versus o percentual
acumulativo de abandono ................................................................... 55
Gráfico 2 Posicionamento dos clusters quanto as variáveis RM ................... 57
Gráfico 3 Qualidade versus número de clusters .............................................. 61
Gráfico 4 Segmento supermercado x Total auto-serviço - número de lojas
(em mil) .................................................................................................. 68
Gráfico 5 Evolução da participação de lojas supermercados no faturamento
total do setor de auto-serviços (em %) ............................................. 69
Gráfico 6 Histograma e P-P Plot do Valor das compras. ................................ 81
Gráfico 7 Histograma e P-P Plot do Número de dias entre compras. .......... 83
Gráfico 8 Gráfico de dispersão entre o Número de dias entre compras e o
Valor das compras. .............................................................................. 84
Gráfico 9 Gráfico de barras do número total, média e valor total de compras
em relação ao mês do ano. ................................................................ 86
Gráfico 10 Número total, média e valor total de compras ao longo dos dias do
ano. ......................................................................................................... 88
Gráfico 11 Função de auto-correlação do número total, média e valor total de
compras ao longo dos dias do ano. .................................................. 89
Gráfico 12 Gráfico de barras do número total, média e valor total de compras
em relação ao dia do mês. ................................................................. 91
Gráfico 13 Gráfico de barras do número de dias desde a última compra em
relação ao dia do mês. ........................................................................ 91
ix
Gráfico 14 Histograma e P-P Plot do valor das compras para as quinzenas.93
Gráfico 15 Gráfico de barras do número total, média e valor total de compras
em relação à quinzena. ....................................................................... 94
Gráfico 16 Gráfico de barras do número diário de compras conforme a
quinzena. ............................................................................................... 95
Gráfico 17 Gráfico de barras do valor médio diário das compras conforme a
quinzena. ............................................................................................... 96
Gráfico 18 Gráfico de barras do valor total diário das compras conforme a
quinzena. ............................................................................................... 97
Gráfico 19 Gráfico de barras do número de dias entre compras conforme a
quinzena. ............................................................................................... 98
Gráfico 20 Histograma do Número de dias entre compras para as quinzenas.99
Gráfico 21 Gráfico de barras do coeficiente de variação das compras em
relação ao dia da semana. ............................................................... 101
Gráfico 22 Gráfico de barras do número total, média e valor total de compras
em relação ao dia da semana. ......................................................... 102
Gráfico 23 Gráfico de barras do número médio diário de compras em função
do dia da semana............................................................................... 103
Gráfico 24 Gráfico de barras do valor diário médio por compra em função do
dia da semana. ................................................................................... 104
Gráfico 25 Gráfico de barras do valor diário total de compras em função do
dia da semana. ................................................................................... 106
Gráfico 26 Gráfico de barras do número de dias entre compras conforme o
dia da semana. ................................................................................... 108
Gráfico 27 Histograma do Número de dias entre compras para as quinzenas.109
x
Gráfico 28 Gráfico de barras com o dia da semana da compra anterior
conforme o dia da semana. .............................................................. 110
Gráfico 29 Gráfico de barras do número total, média e valor total de compras
por loja. ................................................................................................ 112
Gráfico 30 Gráfico de barras do número de dias entre compras por loja. ... 113
Gráfico 31 Gráfico de barras com o número de clientes e a média do número
de compras por cliente para cada loja. ........................................... 113
Gráfico 32 Evolução do número total, média e valor total de compras por loja
ao longo dos meses do ano. ............................................................ 114
Gráfico 33 Gráfico de barras com o número total e o valor médio das
compras por dia da semana para cada loja................................... 114
Gráfico 34 Gráfico de barras com o número médio de dias entre compras por
loja. ....................................................................................................... 115
Gráfico 35 Comparação entre o número de compras e o seu valor médio
entre as duas principais lojas em função da quinzena e do dia da
semana. ............................................................................................... 116
Gráfico 36 Histograma do Número de compras por cliente............................ 119
Gráfico 37 Gráfico de Pareto para o número de compras. ............................. 119
Gráfico 38 Histograma e P-P Plot do Valor médio das compras por cliente.121
Gráfico 39 Histograma e P-P Plot do Valor total das compras por cliente... 122
Gráfico 40 Gráfico de Pareto para o valor total das compras ........................ 122
Gráfico 41 Gráfico de barras do número, média e valor total de compras
conforme a segmentação por quinzena. ........................................ 126
Gráfico 42 Gráfico de barras do número, média e valor total de compras
conforme a segmentação por número de dias da semana. ........ 129
xi
Gráfico 43 Gráfico de barras do número, média e valor total de compras
conforme a segmentação por loja. .................................................. 134
xii
LISTA DE TABELAS
Tabela 1 Resultado final da segmentação de clientes ................................... 58
Tabela 2 Descrição e atributos dos 5 fatores selecionados .......................... 59
Tabela 3 O auto serviço alimentar brasileiro .................................................... 67
Tabela 4 Síntese do resultados - 1999 ............................................................. 67
Tabela 5 Mapa das análises. .............................................................................. 78
Tabela 6 Estatísticas descritivas e percentis do Valor das compras. .......... 80
Tabela 7 Teste Kolmogorov-Smirnov. ............................................................... 81
Tabela 8 Estatísticas descritivas e percentis do Número de dias entre
compras. ................................................................................................ 82
Tabela 9 Estatísticas descritivas do Valor das compras para os diferentes
meses do ano. ...................................................................................... 85
Tabela 10 Percentis do Valor das compras para os diferentes meses do ano.87
Tabela 11 Estatísticas descritivas e percentis do Valor das compras para as
quinzenas. ............................................................................................. 92
Tabela 12 Estatísticas descritivas e percentis do número diário de compras
para as quinzenas. ............................................................................... 94
Tabela 13 Estatísticas descritivas e percentis do valor médio diário das
compras para as quinzenas. .............................................................. 96
Tabela 14 Estatísticas descritivas e percentis do valor total diário das
compras para as quinzenas. .............................................................. 97
Tabela 15 Estatísticas descritivas e percentis do número de dias entre
compras para as quinzenas. .............................................................. 98
xiii
Tabela 16 Estatísticas descritivas do valor das compras para os dias da
semana. ............................................................................................... 100
Tabela 17 Percentis do valor das compras para os dias da semana........... 101
Tabela 18 Percentis do número médio diário de compras para os dias da
semana. ............................................................................................... 102
Tabela 19 Estatísticas descritivas do número médio diário de compras para
os dias da semana. ............................................................................ 103
Tabela 20 Estatísticas descritivas do valor diário médio por compra para os
dias da semana. ................................................................................. 104
Tabela 21 Percentis do valor diário médio por compra para os dias da
semana. ............................................................................................... 104
Tabela 22 Estatísticas descritivas do valor diário total de compras para os
dias da semana. ................................................................................. 105
Tabela 23 Percentis do valor diário total de compras para os dias da
semana. ............................................................................................... 105
Tabela 24 Estatísticas descritivas do número de dias entre compras para os
dias da semana. ................................................................................. 107
Tabela 25 Percentis do número de dias entre compras para os dias da
semana. ............................................................................................... 108
Tabela 26 Estatísticas descritivas e percentis do Número de compras por
cliente. .................................................................................................. 118
Tabela 27 Estatísticas descritivas e percentis do Valor médio das compras
por cliente. ........................................................................................... 120
Tabela 28 Estatísticas descritivas e percentis do Valor total das compras por
cliente. .................................................................................................. 121
Tabela 29 Regressão Número de compras por cliente x Valor médio das
compras por cliente............................................................................ 123
xiv
Tabela 30 Estatísticas descritivas e percentis do número de compras
conforme a segmentação por quinzena. ........................................ 124
Tabela 31 Estatísticas descritivas e percentis do valor médio das compras
conforme a segmentação por quinzena. ........................................ 125
Tabela 32 Estatísticas descritivas e percentis do valor total das compras
conforme a segmentação por quinzena. ........................................ 126
Tabela 33 Estatísticas descritivas e percentis do número de compras
conforme a segmentação por número de dias da semana. ........ 127
Tabela 34 Estatísticas descritivas e percentis do valor médio das compras
conforme a segmentação por número de dias da semana. ........ 128
Tabela 35 Estatísticas descritivas e percentis do valor total das compras
conforme a segmentação por número de dias da semana. ........ 129
Tabela 36 Estatísticas descritivas do número de compras conforme a
segmentação por loja. ....................................................................... 130
Tabela 37 Percentis do número de compras conforme a segmentação por
loja. ....................................................................................................... 131
Tabela 38 Estatísticas descritivas do valor médio das compras conforme a
segmentação por loja. ....................................................................... 132
Tabela 39 Percentis do valor médio das compras conforme a segmentação
por loja. ................................................................................................ 132
Tabela 40 Estatísticas descritivas do valor total das compras conforme a
segmentação por loja. ....................................................................... 133
Tabela 41 Percentis do valor total das compras conforme a segmentação por
loja. ....................................................................................................... 133
xv
SUMÁRIO
CAPÍTULO I O PROBLEMA ................................................................................... 1
I.1. Introdução e pergunta ................................................................................ 1
I.2. Objetivos ........................................................................................................ 2
I.3. Relevância ..................................................................................................... 2
I.4. Delimitação .................................................................................................... 3
I.5. Definição dos termos.................................................................................. 4
CAPÍTULO II REVISÃO DE LITERATURA ........................................................... 5
II.1. Customer Relationship Management (CRM) ........................................ 5
II.1.1. Definição de Customer Relationship Management (CRM) 5
II.1.2. Vantagens do CRM 7
II.1.3. Vantagens da fidelização 8
II.1.4. Como implementar o CRM 11
II.1.5. Cálculo do valor de um cliente 16
II.1.6. Criação de valor para os clientes 19
II.1.7. O papel das novas tecnologias 23
II.2. Extração do Conhecimento..................................................................... 27
II.2.1. O papel dos bancos de dados (database marketing) 27
II.2.2. Definição de Data Mining 33
II.2.3. Benefícios do Data Mining 35
II.2.4. Implementação e etapas do Data Mining 39
II.2.5. Data Warehouse 46
II.2.6. Objetivos,aplicações e técnicas de Data Mining 49
xvi
II.3. Aplicações reais de técnicas de extração de conhecimento ........ 54
II.3.1. Descoberta do perfil dos clientes que não renovam o contrato em
uma empresa de telefonia celular 54
II.3.2. Segmentação de clientes de um shopping duty-free 55
II.3.3. Segmentação e detecção do perfil de compradores on-line 59
II.3.4. Outros exemplos 63
II.4. Fidelização e o varejo ............................................................................... 64
II.4.1. Relacionamento com clientes no varejo 64
II.4.2. Oportunidades do comércio on-line 65
II.4.3. Uma breve descrição do mercado varejista brasileiro 66
II.4.4. Exemplos de aplicação do CRM no mercado varejista brasi leiro 70
CAPÍTULO III METODOLOGIA .............................................................................. 73
III.1. Tipo de pesquisa........................................................................................ 73
III.2. Universo e amostra ................................................................................... 74
III.3. Coleta de dados ......................................................................................... 75
III.4. Tratamento dos dados ............................................................................. 75
III.5. Limitações do método .............................................................................. 77
CAPÍTULO IV ANÁLISES DESCRITIVAS ............................................................ 78
IV.1. Análise das compras ................................................................................ 79
IV.1.1. Análise geral de todas as compras 79
IV.1.2. Análise da evolução das compras ao longo do tempo 84
IV.1.3. Análise dos padrões sazonais de compras 89
IV.1.4. Análise por loja 111
IV.2. Análise dos clientes ................................................................................117
IV.2.1. Análise geral de todos os clientes 117
xvii
IV.2.2. Segmentação por período do mês 123
IV.2.3. Segmentação por número de dias da semana 127
IV.2.4. Segmentação por loja 130
CAPÍTULO V CONCLUSÃO.................................................................................135
V.1. A importância do CRM ...........................................................................135
V.2. Resultados e conclusões da análise dos dados.............................137
V.3. Sugestão para estudos futuros ...........................................................141
REFERÊNCIAS BIBLIOGRÁFICAS ......................................................................144
CAPÍTULO I O PROBLEMA
I.1. INTRODUÇÃO E PERGUNTA
Com o crescimento das empresas multinacionais e com o avanço da
globalização mundial, os mercados estão se tornando mais competitivos. Está
cada vez mais difícil para as firmas se diferenciarem de seus concorrentes e
manter a fidelidade de seus clientes. Uma das alternativas para enfrentar este
cenário é o desenvolvimento de meios de comunicação mais eficientes entre a
empresa, seus clientes e o mercado de consumidores em potencial. A sigla
CRM, Customer Relationship Management, surgiu exatamente para dar nome
a esta prática da administração que visa um maior relacionamento entre
empresas e seus clientes.
Entre as técnicas mais utilizadas para promover o CRM encontra-se a
utilização de bancos de dados com informações sobre os atuais clientes.
Através destes bancos de dados, é possível:
a. Descobrir quais são os seus clientes mais lucrativos e quais são os que
não trazem lucro para a empresa;
b. Conhecer melhor o perfil destes clientes lucrativos e assim desenvolver
meios de comunicação mais baratos e que lhes falem diretamente, sem a
interferência e conhecimento dos concorrentes.
c. Descobrir novos consumidores, que possuem características parecidas
com as dos atuais, mas que, por algum motivo desconhecido, ainda não
utilizam os produtos, ou serviços, oferecidos pela empresa.
Para que se possa explorar todo o potencial dos bancos de dados, é
necessário que as firmas saibam transformar os dados em informações e
conhecimento. Esta tarefa nem sempre é fácil, principalmente em bancos de
dados muito grandes. É neste ponto que técnicas quantitativas exercem um
papel fundamental, transformando um amontoado de números em informações
2
relevantes para as tomadas de decisões. E o data mining nada mais é do que
um conjunto de técnicas quantitativas, entre elas técnicas estatísticas e de
inteligência artificial, que tem por objetivo a extração da informação contidas
em bancos de dados.
Neste contexto, este trabalho tentará responder a seguinte pergunta:
Como técnicas quantitativas podem ajudar no gerenciamento de uma
política de relacionamento entre empresas e clientes?
Para ajudar a respondê-la, apresenta-se uma revisão da literatura sobre este
assunto e, ao final, um exemplo da utilização de algumas destas técnicas em
dados obtidos em um banco de dados de uma empresa de varejo brasileira.
I.2. OBJETIVOS
O objetivo deste trabalho é mostrar como técnicas quantitativas podem
ajudar no gerenciamento de uma política de relacionamento entre empresas e
clientes. Para atingir este propósito final, é necessário que este trabalho
responda a três objetivos intermediários:
a. Mostrar a importância da obtenção de informações sobre os seus clientes
e da utilização de uma estratégia CRM, no sucesso das empresas;
b. Apresentar aos leitores as técnicas de extração de conhecimento, já que
muitas são bastante recentes e ainda não foram muito divulgadas na
literatura brasileira;
c. Exemplificar a utilização de técnicas quantitativas em bancos de dados
através da sua aplicação e da análise dos resultados obtidos.
I.3. RELEVÂNCIA
Com o aumento da velocidade dos computadores, é possível manipular um
maior número de dados, obtendo-se mais informações. Assim sendo, cada vez
mais técnicas quantitativas poderão ser uti lizadas, mesmo em áreas onde o
3
volume de informação antes as tornava inviáveis. A obtenção de informação
sobre os clientes surge como uma destas áreas, onde os computadores
poderão ser utilizados mais freqüentemente para ajudar na formulação das
estratégias empresariais.
Este trabalho se torna relevante pois apresenta algumas técnicas
quantitativas que podem ser implementadas em computadores e que ajudam
na obtenção de informações sobre clientes contidas em bancos de dados.
Deste modo, espera-se que este estudo ofereça uma ajuda às muitas
empresas que se sentem perdidas face à quantidade de dados que possuem
sobre os seus clientes, e não conseguem transformá-los em informação
relevante para a tomada de decisão.
I.4. DELIMITAÇÃO
Este trabalho tem por objetivo mostrar como técnicas quantitativas podem
ajudar no gerenciamento de uma política de relacionamento entre empresas e
clientes. Entretanto, não se pretende detalhar profundamente o processo de
construção de um banco de dados. Não serão abordados tópicos de
informática relativos a bancos de dados, tais como: qual seria a melhor
linguagem, o melhor software e a melhor estruturação para o banco de dados.
Supõe-se que os dados estão armazenados de alguma forma que seja possível
acessá-los rapidamente quando necessário. Também, supõe-se que os dados
já estão salvos em formatos compatíveis aos programas de análise de dados
que serão utilizados. O trabalho também não irá propor quais as medidas de
marketing devem ser tomadas (call center, correspondência direta ou outra
forma de contato). Estas medidas dependem muito da indústria em questão.
Este trabalho se limita a mostrar técnicas quantitativas que auxiliem na
obtenção de informações contidas nos dados, de modo que elas ajudem as
empresas a desenvolverem suas estratégias de CRM.
4
I.5. DEFINIÇÃO DOS TERMOS
Customer Relationship Management (CRM) – Conceito segundo o qual as
empresas devem explorar o relacionamento com seus clientes para obter uma
vantagem estratégica.
Data Mining – Conjunto de técnicas que visam a extração de informação
contida em um banco de dados.
Data Warehouse – Local no banco de dados onde ficam armazenados os
dados. É o armazém de dados.
Database Marketing – Utilização de bancos de dados como uma importante
fonte de informação de auxílio ao marketing e à área estratégica de negócios
de uma empresa.
Machine-learning – Técnica quantitativa onde nenhum modelo pré-definido
para a análise dos dados é imposto. Cabe ao próprio computador detectar este
modelo através dos padrões existentes nos dados. Também é conhecido com
Inteligência Artificial (IA).
Overfitting – Erro comum aos modelos de inteligência artificial que ocorre
quando o método se especializa demais nos dados de treinamento e perde a
capacidade de generalização.
5
CAPÍTULO II REVISÃO DE LITERATURA
II.1. CUSTOMER RELATIONSHIP MANAGEMENT (CRM)
II.1.1. Definição de Customer Relationship Management (CRM)
“Houve um tempo quando varejistas, bancos, companhias seguradoras e negociadores de carros tinham um estreito relacionamento com seus
clientes. Eles freqüentemente os conheciam pessoalmente, sabiam o que eles desejavam e satisfaziam suas necessidades através de um serviço pessoal personalizado. Como resultado, obtinham a lealdade e uma
grande fatia dos consumidores do seu mercado. Este, entretanto, era um sistema custoso e ineficiente e era necessário que os clientes
subsidiassem este relacionamento, pagando altos preços. Com o passar do tempo, com o marketing de massa e o aumento do consumo, os clientes trocaram os relacionamentos pelo anonimato, com uma redução
na variedade e nos preços. Hoje em dia, através do uso eficaz da informação e das tecnologias de
comunicação, esta troca não é mais necessária; as organizações podem oferecer a seus clientes variedade, preços baixos e um serviço personalizado, e tudo ao mesmo tempo. (...) Esta é a prática de CRM.”1
(PEPPARD, 2000, pg. 312).
Fazendo uma definição formal, CRM e marketing de relacionamento são
conceitos que chegam a se confundir. Analisando a definição de Stone,
Woodcock e Wilson (1996, p. 675) para marketing de relacionamento é
possível observar a semelhança entre ambos:
“Marketing de relacionamento é o uso de uma vasta gama de técnicas de marketing, vendas, comunicação, serviço e atendimento ao cliente visando:
a. identificar o cliente individual característico da empresa; b. criar um relacionamento entre a empresa e seus clientes que vá
além das várias transações; c. administrar o relacionamento em benefício dos clientes e da companhia.”2
1 Tradução livre do autor deste projeto.
2 Tradução livre do autor deste projeto.
6
Peppers, Rogers e Dorf (1999, p. 151) chegam a firmar que ambos são a
mesma coisa:
“A idéia é simples: marketing um para um (também chamado de marketing de relacionamento ou customer relationship management) significa estar atento e ser capaz de mudar seu comportamento para uma
maneira voltada para o cliente individual, baseado no que ele diz e no que for possível saber sobre ele.”3
Esta confusão ocorre pois o foco de ambos é o relacionamento com o
cliente, e a construção de uma vantagem competitiva baseada neste
relacionamento.
Para Jackson (1985) existe um espectro contínuo onde em uma ponta se
localiza o marketing de transação e na outra o marketing de relacionamento,
sendo que, normalmente, as situações de negócios se encaixam em posições
intermediárias neste espectro. O autor afirma que nem sempre é justificável um
investimento na linha de frente para ganhar clientes e estabelecer um
relacionamento de longo prazo. Neste extremo, encontram-se os clientes que
fazem compras repetidas de um produto, mas que podem facilmente trocar de
fornecedores, só se interessando por relacionamentos de curto prazo. Neste
caso o marketing de transação seria o mais apropriado. Entretanto, há clientes
que fazem uma série de compras ao longo do tempo e preferem se
comprometerem com somente um vendedor, em troca de um relacionamento e
benefícios de longo prazo. Neste ambiente é justificável que as empresas
aumentem seus gastos para obterem novos clientes e para aumentar o
comprometimento destes. Neste caso o marketing de relacionamento seria o
ideal para estes consumidores e paras as firmas.
Já Newell (2000, p. 8-9) prefere utilizar a definição de CRM feita pelo
Carlson Marketing Group:
"Uma estratégia de negócios que constrói antecipadamente uma tendência ou preferência por uma organização com seus funcionários, canais e clientes, resultando em uma maior retenção e em um
desempenho melhor.”
3 Tradução livre do autor deste projeto.
7
II.1.2. Vantagens do CRM
Não há acordo entre os autores se o CRM traz vantagens que já poderiam
ser medidas no curto prazo. Peppers, Rogers e Dorf (1999) afirmam que o
CRM não traz somente benefícios de longo prazo. É possível observar alguns
resultados deste programa já no curto prazo, tais como: aumento das vendas
cruzadas, redução da deserção de clientes, aumento em seu nível de
satisfação e diminuição dos custos de transação, tornando mais rápidos os
ciclos de compras. Contudo, Newell (2000) discorda, alertando que pode levar
até três anos para que uma política de CRM apresente resultados expressivos.
Apesar da discordância quanto às vantagens de curto prazo, há um
consenso em relação aos benefícios trazidos pelo CRM no longo prazo. O
primeiro deles seriam as informações sobre os clientes. Stone, Woodcock e
Wilson (1996) afirmam que através do marketing de relacionamento as
empresas podem obter inúmeras informações tais como:
a. A análise detalhada da lucratividade atual e esperada deste
relacionamento de longo prazo;
b. Novos serviços de que seus clientes precisem;
c. O nível do relacionamento sob o ponto de vista dos clientes e qual o tipo
de relacionamento eles gostariam de ter;
d. As políticas de aquisição e retenção de clientes praticadas por seus
concorrentes;
e. O grau de satisfação dos métodos atuais de relacionamento e se eles
atingem as expectativas dos clientes;
f. Testes de novos modelos de relacionamento.
Entretanto, a maior vantagem trazida pelo CRM é o relacionamento com os
clientes. Segundo Peppard (2000), o principal foco do CRM é um
relacionamento estreito e profundo com seus clientes. Seu objetivo principal é
maximizar o valor do cliente para a organização. As vantagens deste
8
relacionamento com os clientes são irresistíveis: a construção da comunicação
bilateral; a possibilidade de antecipar os seus desejos observando o seu
comportamento; e a retenção dos mesmos, que tem se mostrada mais lucrativa
do que a atração de novos consumidores.
Kelly (2000), Pine II, Peppers e Rogers (1995), Saunders e Metzer (2001) e
Stone, Woodcock e Wilson (1996) também concordam que o relacionamento
leva ao aumento da retenção e lealdade dos clientes e ao aumento da
lucratividade.
II.1.3. Vantagens da fidelização
Como é possível perceber, uma das vantagens mais citadas pelo CRM é a
retenção, a lealdade e a fidelização dos clientes. Mas quais são as reais
vantagens da fidelização de clientes para as empresas?
Segundo Pessanha Filho (2000), clientes fiéis compram mais
freqüentemente, defendem a empresa, são menos atentos à concorrência e
compram extensões das linhas de produtos das quais já são consumidores. A
retenção de clientes também se reflete internamente na empresa já que
proporciona uma satisfação maior nos funcionários.
Pine II, Peppers e Rogers (1995) também alertam para a importância que a
fidelização tem no aumento da lucratividade da empresa. Quanto mais tempo
os clientes são fiéis à empresa, mais lucrativos eles se tornam devido às
compras repetidas, à redução nos custos fixos, aos preços premiums, à
redução no custo de aquisição e à ajuda dada através de sugestões.
Para Stone, Woodcock e Wilson (1996) a fidelização de clientes impacta
positivamente na lucratividade através da diminuição dos custos de
recrutamento de novos clientes e da redução do custo das vendas.
Os programas de fidelização têm como objetivo aumentar a satisfação dos
clientes. Anderson, Fornell e Lehmann (1994) afirmam que as organizações
cujos clientes estão satisfeitos conseguem retornos financeiros superiores
devido ao:
9
a. Aumento da lealdade, aumentando o valor do cliente devido às compras
repetidas no futuro;
b. Redução da elasticidade no preço, pois clientes satisfeitos aceitam pagar
mais;
c. Redução da possibilidade dos seus clientes serem afetados pelos apelos
dos competidores;
d. Diminuição do custo das transações futuras;
e. Redução dos custos por falhas, já que como os desejos dos clientes são
atendidos, há poucas falhas para serem corrigidas;
f. Diminuição do custo de atração de novos clientes;
g. Aumento da reputação da firma, facilitando a aceitação de novos
produtos que poderiam ser rejeitados devido aos riscos de tentativas.
Já segundo Pine II, Peppers e Rogers (1995) esta política de relacionamento
entre empresa e clientes pode levar à vantagem competitiva. O primeiro motivo
é que quanto mais informações os clientes passam para a empresa, melhor se
torna o serviço prestado por ela, tornando a competição mais difícil para os
concorrentes. Estas informações, e a relação de aprendizagem, se tornam uma
vantagem competitiva para a empresa, permitindo que ela continue a oferecer
um serviço ou produto customizado de alta qualidade, com preços competitivos
e que esteja sempre utilizando tecnologias atualizadas. O segundo motivo é
que a troca de informações requer um esforço por parte dos clientes. A decisão
de acabar com um relacionamento e iniciá-lo com uma outra empresa exige
que os clientes refaçam todo este trabalho de fornecimento de dados. Assim
sendo, quanto maior for a quantidade de informações que uma empresa possui
sobre os seus clientes, maior o comprometido destes com o relacionamento,
trazendo uma vantagem competitiva para a organização.
Evans e Wurster (1997) concordam que a informação pode não somente
limitar e restringir um relacionamento, mas pode servir como base para a
formação de uma vantagem competitiva. Para os autores, a informação é a
10
“cola” que liga e une a estrutura de um negócio. Quando administradores falam
sobre o valor do relacionamento com os clientes, eles deveriam estar
preocupados com a informação que eles possuem sobre os seus clientes e a
informação que estes possuem sobre a empresa, pois assim estariam
construindo uma vantagem competitiva para suas firmas.
Jackson (1985) também destaca que o aumento nos custos de mudanças
percebidos pelos clientes é uma das vantagens obtidas com o desenvolvimento
de uma política de fidelização de clientes. Analisando de uma maneira simples
e direta, um programa de fidelização bem sucedido cria custos de mudanças
para os clientes, de modo que seja melhor para eles permanecer com a
empresa. Por isso, as companhias que desejam manter seus clientes devem
manter o custo de mudança maior que o custo de permanência. O primeiro
custo de mudança é o investimento que os clientes precisam fazer para se
adaptarem aos novos produtos, serviços ou sistemas. Estes investimentos
podem ser em dinheiro, pessoas, ativos e procedimentos. Quanto maior for o
investimento, maior será a relutância para a mudança. A segunda maior
categoria de custos de mudanças se refere ao risco e à exposição necessária
para realizar a mudança, ou seja, o perigo do cliente fazer uma escolha errada.
O medo de uma ruptura e de uma performance insatisfatória pode tornar o
cliente relutante à mudança.
Alguns autores mostram exemplos numéricos proporcionados pela
fidelização de clientes.
Saunders e Metzer (2001) concordam com os benefícios que um programa
de fidelização de clientes pode trazer. Eles afirmam que estudos têm mostrado
que as empresas gastam cinco vezes mais para conquistar novos clientes do
que para manter os atuais, e que é possível aumentar os lucros em 100%
aumentando a taxa de retenção dos clientes em apenas 5%.
Kelly (2000) cita alguns exemplos que mostram o valor da retenção de um
cliente:
11
a. Clientes insatisfeitos contam seu desapontamento para outras dez
pessoas, sendo que dessas, 12% espalham para outras 20 pessoas;
b. Custa 5 vezes mais atrair novos clientes do que manter os atuais;
c. Se 20 clientes estão insatisfeitos com você, 19 não dirão mas irão
embora;
d. Clientes satisfeitos contam para outros 5 clientes sobre suas
experiências positivas;
e. A maneira como você trata os clientes é um dos primeiros pontos de
comparação que os clientes fazem entre você e seus concorrentes;
f. Clientes satisfeitos quase sempre dão referências sobre outros pontos de
vista.
II.1.4. Como implementar o CRM
Peppers, Roger e Dorf (1999) afirmam que para começar o CRM, a empresa
deve primeiramente saber situar a estágio atual do seu relacionamento com
seus clientes. Depois disto, há quatro passos chaves para colocá-lo em
funcionamento:
a. Identificar seus clientes – É necessário que a empresa seja capaz de
localizar e entrar em contato com um bom número de clientes,
principalmente os mais valiosos. Por isso é importante obter a maior
quantidade de informação possível sobre eles (não somente dados
demográficos, mas também os hábitos e as preferências). Também é
necessário que a empresa obtenha informações em cada contato, e não
somente em um determinado período de tempo. Caso não seja possível
para a empresa obter estas informações de seus clientes finais é
possível tentar este tipo de relacionamento com seus clientes diretos.
b. Diferenciar seus clientes – Os clientes são diferentes pois têm diferentes
necessidades e porque têm diferentes valores para a empresa. O passo
seguinte após identificá-los é diferenciá-los, pois assim é possível
12
focalizar os esforços nos mais rentáveis e moldar o comportamento da
empresa de modo que ela possa atingir os valores e necessidades de
cada cliente.
c. Interagir com os seus clientes – Melhorar o binômio custo-eficiência e a
eficácia dos contatos com os clientes são componentes críticos do CRM.
É possível melhorar o custo-eficiência adotando métodos automáticos e
mais baratos de interação direta com os clientes. E para melhorar a
eficácia é necessário que a empresa gere informações interessantes e
rápidas sobre os desejos e valores dos clientes, lembrando que em cada
contato ela deve utilizar as informações obtidas em todos os contatos
anteriores.
d. Customizar o comportamento da empresa – Para prender seus clientes
num relacionamento, a empresa deve adaptar alguns aspectos do seu
comportamento para atender os desejos expressos de seus clientes. Isto
pode ser feito através da customização em massa de seus produtos, ou
moldando algum aspecto dos serviços que envolvem os produtos.
Os dois primeiros passos (identificar e diferenciar os clientes) são
considerados análises internas, enquanto os dois últimos (interagir e
customizar) são ações externas, visíveis para o consumidor. Ainda segundo os
autores, após decidir implantar o programa, cabe à empresa definir quais os
aspectos mais importantes e priorizá-los, nunca esquecendo que as prioridades
devem obedecer aos desejos e valores dos clientes. De qualquer modo, quanto
mais diferenciada sua base de clientes e quanto maior a concentração de
clientes lucrativos em uma pequena parcela de sua base total, mais eficiente e
menos custoso será o relacionamento.
Pine II, Peppers e Rogers (1995) alertam que a implantação do CRM pode
ser mais difícil dependendo da posição da empresa na cadeia de fornecimento
e do tipo de indústria. Empresas que não têm o contato direto com o cliente
final têm maiores dificuldades de construir este relacionamento. Entretanto elas
podem construir este relacionamento com seus clientes diretos. Outro exemplo
de indústria que enfrenta dificuldade na implantação do CRM é a de fabricantes
13
de produtos com pequeno valor unitário (tais como os clipes para papéis).
Neste caso a solução é a construção do relacionamento com os varejistas que
interagem diretamente com os clientes finais. Empresas que vendem
commodities também enfrentam dificuldades na customização dos seus
produtos aos gostos dos clientes, contudo elas podem oferecer serviços pós-
venda diferenciados.
Os mesmos autores também dizem quais são as indústrias onde o
relacionamento pode ser construído mais facilmente. São as indústrias e
prestadores de serviço onde: o cliente compra sempre o mesmo tipo de
produto, o produto pode ser enviado diretamente à casa do cliente e onde já há
uma relação existente entre a marca e o cliente.
No caso de empresas que tenham como clientes outras empresas, Knox
(1998) afirma que a administração tradicional baseada em contas não traz
benefícios pois a comunicação é feita exclusivamente através do gerente de
conta. Para o autor este relacionamento deveria evoluir para um estágio onde
as interações empresa-cliente e empresa-vendedor ocorrem em vários pontos.
Com a construção deste relacionamento os custos de transação diminuiriam e
ambas seriam beneficiadas. Newell (2000) lembra que mesmo em relações
empresa-empresa, os clientes finais são sempre indivíduos, possibilitando o
desenvolvimento de um programa de relacionamento personalizado.
Newell (2000) também fala das particularidades da implantação do CRM em
outras indústrias. No varejo, as empresas devem abandonar o antigo foco em
vender qualquer produto, em qualquer lugar, a qualquer hora e para todos os
clientes. Os varejistas devem se concentrar em manter os clientes mais
lucrativos, oferecendo-lhes produtos selecionados e que lhes tragam
satisfação. Neste ambiente, a internet deve ser considerada uma aliada que
pode ajudar a trazer o cliente para a loja real.
Na industria de bens de consumo, onde as empresas não vendem
diretamente seus produtos para os clientes, Newell (2000) afirma que só há
duas alternativas para a criação de um relacionamento com os principais
clientes finais. A primeira é a criação de parcerias com os canais de vendas
14
para que eles possam estar fornecendo informações sobre os clientes finais. A
segunda é escolher melhor os canais de marketing, de modo que a empresa
deixe de gastar dinheiro com aqueles que não são clientes potenciais ou que
não geram lucro.
Este mesmo autor afirma que as instituições financeiras já perceberam o
valor que o CRM pode trazer para a empresa. Os bancos criaram serviços e
produtos customizados que dão motivos para os clientes permanecerem fiéis.
Este é um ótimo exemplo do papel que a tecnologia pode exercer, facilitando a
comunicação com os clientes, através de múltiplos canais.
A última indústria na qual Newell (2000) mostra as particularidades e as
vantagens da implantação do CRM é a mídia. Na mídia, o CRM fornece duas
oportunidades: aumentar o envolvimento do público para reduzir a queda na
audiência e ajudar os anunciantes identificando quem são os melhores clientes
para os seus produtos específicos. O autor afirma que mesmo os meios de
comunicação de massa devem tentar desenvolver um relacionamento com os
seus clientes, pois os anunciantes preferirão utilizar os meios onde eles sabem
para quais clientes estão falando.
Mesmo com todo o planejamento e seguindo todos os passos para
implementar o CRM com sucesso, um componente e que não deve ser
esquecido é o comprometimento da empresa como um todo. Davids (1999)
afirma que uma das maiores causas de falhas na implementação do CRM é a
organização da própria firma onde o programa está sendo implantado.
Segundo o autor, alguns dos erros mais comuns são: não ter uma estratégia a
priori, subestimar o grau de envolvimento necessário em toda a companhia,
não buscar soluções fora da firma quando for necessário, demorar muito para
operacionalizar o programa, não começar pequeno e superestimar o esforço
necessário para começar.
Pine II, Peppers e Rogers (1995) reafirmam a importância da empresa
perceber que a implementação do CRM só é possível se houver uma mudança
de mentalidade dentro dela própria. Ela deve ter consciência que a implantação
15
do relacionamento só é possível se, em vez de fazer produtos e empurrá-los
para os clientes, ela passar a fazer o que os clientes pedem.
Newell (2000) afirma que a implantação do CRM exigirá mudanças
fundamentais dentro da organização, passando por todas as áreas. Para que o
CRM seja mais facilmente vendido para a direção da companhia, é necessário
que haja um defensor de nível sênior. O sucesso de CRM também requer a
ampla comunicação em toda a empresa, de modo que todos os participantes o
vejam como um benefício para eles e seus clientes. O relacionamento com o
cliente deve se tornar parte da marca da firma. Para que a implantação seja
monitorada com sucesso, novas medidas de avaliação serão exigidas. Elas
devem revelar o valor que o relacionamento está trazendo para a empresa e
para os seus clientes, e não se basearem em resultados financeiros de curto
prazo.
Stone, Woodcock e Wilson (1996) observam que muitas organizações
quando adotam o marketing de relacionamento não desenvolvem uma cultura
interna (com atitudes e estruturas organizacionais) para administrar os
diferentes tipos de relacionamento que serão necessários. Com isso, elas não
usufruem todos os benefícios do relacionamento.
Taurion (2001b) faz o alerta: é necessário que a empresa entenda que não
adianta colocar a responsabilidade no departamento de marketing e deixar tudo
como estava antes. É necessário comprometimento e tempo para o
relacionamento produzir os frutos esperados.
Entretanto, mesmo havendo o comprometimento da empresa e seguindo-se
todos os passos sugeridos na implantação de uma política de relacionamento
com o cliente, o sucesso não é obtido de um dia para o outro. Ele precisa ser
continuamente monitorado. O relacionamento se desenvolve em etapas, e a
implementação de CRM deve estar preparada para dar suporte à companhia
em todos estes momentos. Segundo Stone, Woodcock e Wilson (1996) os
diferentes estágios dos relacionamentos para os quais as empresas precisam
estar preparadas são:
16
a. Recrutamento – Quando o cliente é visto como um cliente apropriado
para a firma e é induzido a juntar-se a ela;
b. Boas Vindas – Depois de juntar-se, é necessário que a empresa se
assegure que o cliente realmente esteja integrado a companhia;
c. Aquisição de conhecimento – Este estágio é essencial, pois é quando
ocorrem as primeiras trocas de informações entre ambos;
d. Administração da conta – É quando o relacionamento já está
estabelecido e cabe à empresa mantê-lo, continuando a obter
informações atualizadas sobre os clientes. É o estágio ideal, que todas
as organizações buscam ter com seus clientes mais lucrativos;
e. Cuidado intensivo – Quando o relacionamento com o cliente apresentou
algum problema é necessário dar-lhe uma atenção especial para se ter
certeza de que ele retornará a relacionar-se com a empresa;
f. Divórcio potencial – A insatisfação do cliente é tanta que o divórcio é
iminente;
g. Divórcio – Apesar do cliente estar afastado da empresa, é possível que
após algum período de esfriamento dos ânimos, ele volte;
h. Retorno – Se o divórcio foi causado por altos preços ou por um produto
errado é mais fácil contorná-lo de que se ele for causado por um serviço
ruim (a não ser que o dos concorrentes seja pior).
II.1.5. Cálculo do valor de um cliente
Como pôde ser reparado, uma das primeiras tarefas a serem realizadas na
implementação de CRM é o cálculo do valor de seus clientes ao longo do
relacionamento. Buttle (2001) afirma que existem quatro tipos de clientes
estrategicamente importantes, e que as empresas deveriam se esforçar para
cativá-los:
a. Clientes fiéis, que compram em grandes volumes e suas exigências não
são maiores que sua lucratividade para a empresa;
17
b. Clientes que têm poder de influência sobre as outras pessoas;
c. Clientes que fazem críticas construtivas e ajudam as empresas a detectar
e corrigir seus defeitos;
d. Clientes cujo atendimento envolve o dispêndio de um custo fixo, deste
modo eles entram na divisão dos custos totais, diminuindo o custo de
atendimento dos demais.
Para Knox (1998), as empresas deveriam segmentar sua base de clientes
segundo a sua fidelidade com a organização. O desenvolvimento de clientes
deve capitalizar o envolvimento com o cliente quando este for presente e
explorar a indiferença dos clientes quando for lucrativo. Essencialmente isto
significa que os mais lucrativos devem ser apoiados em seus comportamentos
e crenças com um pacote de benefícios que represente o valor econômico
estimado que eles têm para a empresa. Estes clientes leais tendem a gastar
mais com as empresas preferidas e servem como fonte de novos clientes. Por
outro lado, os clientes sem valor devem receber o tratamento inverso. Uma vez
identificados, os recursos que antes eram direcionados para eles devem ser
seletivamente racionalizados e direcionados para os mais lucrativos.
Newell (2000) concorda que o CRM não deve ser dirigido para todos os
clientes da empresa. O verdadeiro objetivo do CRM é detectar os melhores e
os potencialmente melhores, para que ela possa focalizar os seus esforços
nestes grupos. A retenção começa com o recrutamento dos clientes certos.
Normalmente, observa-se que menos de 1% dos clientes é responsável por
quase 10% das vendas, e uma participação ainda menor contribui com 10% do
lucro total de uma empresa. Segundo a filosofia do CRM, os melhores clientes
são o ativo mais valioso de uma organização. Uma imensa participação de
mercado nem sempre garante altos lucros. O segredo não é obter muitos
clientes. É conseguir os clientes certos e mantê-los.
Seguindo esta linha de raciocínio, Davids (1999) afirma que um dos grandes
erros cometidos por empresas na construção do CRM é o não questionamento
de qual será a contribuição deste relacionamento para a própria empresa. O
18
autor alerta que, apesar do cliente ter sempre razão, ele não é sempre lucrativo
e por isso, um programa eficaz de CRM precisa considerar o seu valor ao longo
de sua vida.
Pine II, Peppers e Rogers (1995) também alertam para a importância do
aumento da lucratividade obtido através do cálculo do valor do cliente ao longo
de sua vida. Segundo os autores, a estratégia de pagamentos é um dos
componentes principais que devem ser pensados quando se vai construir um
relacionamento. Por isso, as empresas devem decidir com cuidado qual o nível
de relacionamento que vale a pena.
Stone, Woodcock e Wilson (1996) também falam sobre a importância do
cálculo do valor do cliente para a companhia. Conforme os autores, o modo
tradicional de administrar os clientes tem como objetivo tentar atingir qualquer
um que queira comprar os produtos e administrá-los da mesma maneira. Só se
faz exceção para os maiores. Esta forma de gerenciar os clientes está
ultrapassada. Na realidade, as empresas deveriam deixar de trabalhar com os
que nunca serão lucrativos e manter o foco no recrutamento e manutenção
daqueles que possuem alto valor no longo prazo. Somente assim elas
aumentariam sua força competitiva e a lucratividade.
Conforme o artigo publicado pela Qube Consulting (2001), calcular o valor
monetário de um cliente é fundamental pois torna possível identificar quem são
os mais lucrativos e nestes concentrar os esforços. O CRM não se justifica
somente pelo fato de reter mais clientes, ele só é viável se for possível
aumentar a lucratividade da empresa aumentando a fidelização dos
consumidores.
Ainda segundo a consultoria, conseguir prever o valor de um cliente também
ajuda a responder muitas perguntas que normalmente aparecem quando se
pensa em realizar um plano estratégico voltado para a sua retenção:
a. Qual será o aumento na retenção de clientes se for feita uma intervenção
ativa neste sentido?
b. Como a retenção vai se refletir nas vendas?
19
c. Quais os segmentos de clientes devem ser focalizados na retenção?
d. Deve-se gastar em marketing ou em operações para conseguir atingir o
objetivo?
Como último aviso sobre a importância da segmentação dos clientes
conforme o valor que trazem para a organização, fica a constatação de
Anderson, Fornell e Lehmann (1994) de que apesar de ser intuitivamente
esperado, nem sempre market-share e satisfação dos clientes andam lado a
lado. Se por um lado o aumento da base de clientes traz economias de escala,
por outro ele dilui as possibilidades de tratamento diferenciado, contribuindo
para a insatisfação dos clientes.
II.1.6. Criação de valor para os clientes
Outra condição essencial muito citada para o perfeito funcionamento do
relacionamento, é a criação de valor para o cliente. Davids (1999) afirma que o
CRM não deve ser visto como um programa de vendas, pois o cliente só dará
as informações necessárias se perceber que receberá algo em troca. Davids
(1999, p. 23) utiliza colocação de Arthur Hughes, vice-presidente da Database
Marketing: “você têm que ser capaz de imaginar o seu cliente dizendo „eu sou
grato por vocês estarem fazendo isto porque ...‟ – e você sabe quais são estas
razões”.4
Anderson e Naurius (1998) afirmam que saber quais os elementos que seus
clientes valorizam é importante pois ajuda a:
a. Administrar os produtos já oferecidos pela empresa – Às vezes itens
considerados da fábrica, deveriam ser vendidos como acessórios
somente para quem os deseja, pois assim muitos clientes que não os
necessitam poderiam receber um desconto no preço.
4 Tradução livre do autor deste projeto.
20
b. Desenvolver novos produtos – É importante saber se o cliente está
realmente disposto a pagar a diferença de preço para receber um novo
serviço.
c. “Ganhar” os clientes – A empresa passa a oferecer propostas de valor
persuasivas.
d. Sustentar o relacionamento com o cliente – O relacionamento com o
cliente deve ser baseado em confiança e empenho. A aplicação do CRM
ajuda a mostrar que a empresa está comprometida nesta relação.
Fournier, Dobscha e Mick (1998) constatam que infelizmente, ao olhar mais
de perto o fenômeno dos relacionamentos entre empresas e clientes, percebe-
se que nem tudo está perfeito pois as empresas não estão sendo capazes de
criar benefícios para seus clientes. Quando se conversa com as pessoas sobre
sua vida de consumidor, ouve-se muita reclamação sobre confusões,
estresses, insensibilidade e manipulação de mercado, fazendo-as se sentir
vítimas e enganados. Os autores mostram o relacionamento de marketing do
ponto de vista do cliente:
a. O número de relacionamento um para um que as empresas pedem para
os consumidores manterem é insustentável. O resultado é que muitas
iniciativas parecem triviais e inúteis, em vez de únicas e valiosas;
b. Existe um balanço entre dar e obter um bom relacionamento. Mas
quando as empresas pedem a amizade, a lealdade e o respeito de seus
clientes elas freqüentemente não dão amizade, lealdade e respeito em
troca.
c. Companhias falam de importância em se medir o valor de cliente.
Entretanto algumas vezes eles se sentem em desvantagem devido à sua
lealdade. Outras vezes, a preocupação das empresas com os clientes
mais lucrativos deixa os outros clientes lucrativos se sentindo excluídos e
desapreciados;
21
Segundo os autores, as regras universais da amizade são: dê suporte
emocional, respeite a privacidade, preserve a confiança e seja tolerante com
outras amizades. As empresas violam todas estas regras. As organizações
precisam se comportar de modo que demonstrem para os clientes que elas
podem ser valiosas com parceiras. Elas devem provar através de ações que o
marketing de relacionamento não precisa ser vazio, sem significado ou
estressante. A verdadeira intimidade com o cliente necessita um profundo
conhecimento de contexto no qual os produtos e serviços são usados no seu
dia-a-dia.
Newell (2000) afirma que a maioria dos programas de fidelização fracassa
porque uma organização de marketing não sabe como o cliente se beneficia
deles. Muitas empresas acham que um cartão de fidelidade é suficiente para
deixá-los satisfeitos. A maioria dos programas de fidelização já não é especial.
Qualquer programa de pontos ou de descontos pode ser imitado rapidamente
pelo concorrente e a empresa que tiver mais recursos financeiros acabará
saindo com vencedora. O verdadeiro CRM deve se concentrar no que o cliente
valoriza, e não no que a empresa deseja vender. Segundo o autor, todo contato
ou comunicação com o cliente deve ser positivo, do ponto de vista do cliente.
As empresas devem prestar atenção em quatro recados fundamentais
passados pelos clientes ao implementar o CRM:
a. Os clientes exigem pré-requisitos mínimos para fazerem negócios com
uma empresa. Estes pré-requisitos funcionam como elementos
qualificadores. Sem eles, os clientes não fazem negócios, mas as
organizações não devem contar com eles para construir a fidelidade;
b. Além de oferecer o mínimo necessário, as firmas devem se esforçar
continuamente para oferecer valor para os clientes. Somente assim elas
conseguirão se diferenciar das outras empresas que também
ultrapassam os pré-requisitos básicos;
c. Uma das maneiras de aumentar o valor do serviço oferecido pela
empresa é acabar com os procedimentos que irritam os clientes. Muitas
vezes, estes procedimentos são tradicionais na indústria, mas do ponto
22
de vista do cliente só atrapalham o relacionamento. Os clientes irão
preferir as empresas que eliminam estes procedimentos;
d. Muitas das iniciativas que as empresas pensam estar agradando passam
desapercebidas. Para saber quais esforços serão percebidos como
valiosos pelos clientes, as empresas devem realizar pesquisas.
O procedimento correto de criação de valor para os clientes deveria ser:
a. Identificar os valores do consumidor que são pertinentes à sua empresa.
b. Entender a importância relativa desses valores a cada segmento de
cliente.
c. Determinar se esses valores afetarão o resultado financeiro
positivamente.
d. Comunicar e oferecer os valores adequados a cada segmento.
e. Medir os resultados e fornecer retorno sobre o investimento (ROI).
Stone, Woodcock e Wilson (1996) dão algumas sugestões de como as
empresas podem fazer o cliente perceber o valor que receberão com o
relacionamento:
a. Criar uma marca que passe confiança;
b. Mostrar os benefícios e as vantagens dos diferentes tipos de
relacionamento;
c. Promover diversos modos de acesso dos clientes a seus produtos;
d. Garantir que os clientes possam facilmente ter acesso às informações
sobre o relacionamento e seus benefícios.
Kelly (2000) concorda que para se manter um cliente por toda a vida deve-se
começar por vendê-lo o produto correto, pelo preço certo e para as
necessidades certas. As empresas devem ter em mente que os clientes
querem fazer negócio do jeito que lhes convier, sempre, e preferem comandar
a compra. Eles também gostam de receber avisos de que são apreciados pela
23
companhia. Para mantê-los, as empresas devem: atender sempre suas
necessidades cultivando a sua felicidade e antecipar os seus desejos futuros.
Ou seja, o segredo para maximizar o valor dos clientes pode ser resumido em
atendê-los do jeito que eles querem ser atendidos. Para implantar esta
estratégia de maximização do valor do cliente, as empresas devem
primeiramente analisar o produto que oferecem e em seguida analisar o
mercado. O próximo passo é analisar os canais de distribuição. O objetivo final
é: vender os produtos mais lucrativos para os mercados mais lucrativos através
dos canais de distribuição mais baratos.
Dado que a criação de valor é um pré-requisito fundamental para o sucesso
do CRM, a comunicação com os clientes também deve ser feita de modo que
lhes seja favorável. Newell (2000) afirma que esta comunicação deve ser
planejada, trazendo algum benefício para eles, tais como: informações vitais, o
reconhecimento da importância do cliente, atenção personalizada e uma noção
de amizade. A empresa deve adotar uma postura pró -ativa e ter um plano de
comunicação para cada cliente, e até mesmo para os ex-clientes e para os
potenciais. Jamais se deve esquecer que o diálogo é a palavra mais importante
no léxico do CRM, mas este diálogo deve ser nos dois sentidos.
Resumindo toda esta questão sobre a importância da criação de valor para o
cliente, Newell (2000) afirma que as empresas devem saber que suas ações
contarão mais de que suas palavras e que o CRM no fundo consiste na
prestação de um serviço. E por isso, é necessário surpreender sempre os
clientes, incorporando aos produtos serviços que lhes tragam valor.
II.1.7. O papel das novas tecnologias
Como já foi dito, as novas tecnologias desempenharam um papel
fundamental no desenvolvimento do CRM.
Segundo Evans (1997), quando a informação se propagava somente através
de meios físicos, havia uma lei básica: o trade-off entre riqueza e alcance.
Alcance significa o número de pessoas que trocam a informação. Riqueza é a
qualidade desta informação, e pode ser definida por três aspectos: largura da
24
banda, customização e interatividade. Este trade-off acabou com o surgimento
dos meios de comunicações eletrônicos. Entretanto, apesar de todos os
negócios serem afetados pela mudança na economia da informação, nem
todos serão com a mesma intensidade. No caso do relacionamento entre
empresas e cliente, os principais impactos das novas tecnologias são:
a. O poder de barganha mudará como resultado de uma redução na
possibilidade de monopolizar o controle da informação;
b. O custo de mudança para os clientes diminuirá, e as empresas terão que
desenvolver novos métodos de promover a lealdade dos clientes.
Stone, Woodcock e Wilson (1996) fazem uma observação com relação ao
comportamento dos usuários destas novas tecnologias. Eles afirmam que estes
clientes são: mais freqüentes, adaptativos, não possuem tecnofobia e possuem
um nível de renda maior. Por isso, eles seriam muito atraentes para as
organizações.
Peppard (2000) afirma que a promessa do marketing um para um, a análise
de valor do cliente e a customização em massa se tornaram possíveis graças
aos avanços nas tecnologias e nas comunicações. O autor também ressalta
que a tecnologia permite que se alcance os clientes de diversas maneiras:
internet, TV digital, cartões inteligentes, telefones e quiosques. E que é
necessária a troca perfeita de informação entre estes canais, fato nem sempre
observado nas companhias.
Pine II, Peppers e Rogers (1995) afirmam que a tecnologia permite dois
avanços:
a. Customização em massa: a empresa é capaz de fornecer produtos e
serviços customizados para seus clientes. Este é exatamente o oposto
da produção em massa focada no produto, paradigma vigente em muitas
empresas onde a empresa deve empurrar seus produtos através dos
canais de distribuição, para assim atingir seus consumidores.
25
b. Marketing um para um: a empresa adquire informações sobre os desejos
e necessidades dos seus clientes, e faz a comunicação com eles
baseada nestas informações. Este é o oposto do marketing de massa,
onde se usa a tecnologia de informação para definir o cliente padrão.
Em seu artigo original, Pine, Victor e Boynton (1993) definem a
customização em massa como um mundo onde a imprevisibilidade de cada
cliente pode ser considerada uma oportunidade que para ser explorada. As
organizações poderão estar constantemente gerando novos produtos.
Qualidade e custos baixos, assim como customização e custos baixos, eram
considerados antônimos. Mas com a customização em massa, percebeu-se
que era possível ultrapassar este modelo de trocas: as empresas poderiam ter
ambos. Em um ambiente de customização em massa, ninguém sabe ao certo o
que os clientes desejarão, e por isso não sabem quais os produtos que devem
ser criados. Ninguém sabe qual a janela de mercado que se abrirá, e
conseqüentemente, ninguém pode criar uma visão de longo prazo sobre os
seus produtos. Entretanto, todos sabem que os clientes desejarão algo, que
esta oportunidade estará aí e que poderá ser explorada.
As únicas ressalvas quanto à utilização da tecnologia são feitas por Davids
(1999) e Apicella (1999). Segundo o primeiro autor, é necessário que as
empresas sempre comecem a adotá-las em projetos pequenos, e somente ir
crescendo aos poucos. Todos os passos devem ser precedidos de testes, para
evitar falhas. Mas por outro lado, o segundo autor afirma que a implementação
de uma tecnologia voltada para CRM pode ser um grande desafio, pois, se for
muito demorada, aumenta as chances da empresa ser ultrapassada por seus
concorrentes, ficar sem dinheiro e perder o interesse pelo projeto.
E a internet também tem um papel importante nesta mudança de cenários.
Segundo Sweat (2000), com o desenvolvimento da internet, os consumidores
estão se tornando cada vez mais exigentes. Este fenômeno ocorre pois a rede
mundial de computadores (através dos sites de informação, grupos de
discussão e sites de comparação de preços) facilita a obtenção de informação
sobre as companhias, seus produtos, serviços e preços, ajudando o cliente na
26
sua tomada de decisão. Entretanto, a internet também pode ajudar as
empresas, pois estas podem conseguir mais informações sobre os seus
clientes, possibilitando oferecer-lhes mais valor.
Newell (2000) também fala do impacto das novas tecnologias no CRM. A
internet terá um papel fundamental no relacionamento entre empresas e
clientes. As organizações devem entender e aceitar a nova ordem econômica
da Internet, e devem pensar nela como sendo mais do que um simples e-
commerce. O valor da web não está na tecnologia, está nos benefícios que ela
traz para as pessoas. A internet é importante pois ela será um canal onde será
possível estabelecer diálogo com indivíduos, obtendo informação e ouvindo-os.
A internet é um meio dos clientes fazerem negócios mais facilmente com uma
firma, permitindo que ela reaja em tempo real. Outra facilidade da internet são
os e-mails. Os clientes valorizam empresas que se comunicam através de e-
mails, mas estes não devem ser utilizados somente de forma passiva. Eles
devem permitir que a empresa converse individualmente com cada cliente em
uma escala maciça. A comunicação por e-mail deve trazer valor para os
clientes, por isso ela deve ser simples, curta e objetiva.
Newell (2000) também ressalta a importância de outras tecnologias que não
são tão recentes quanto a internet, mas que ainda oferecem oportunidades
para serem exploradas: o telemarketing e os call centers. Eles devem ajudar
na construção de relacionamentos por telefone com a confiança e o respeito
mútuos. Eles devem fornecer informações úteis para os clientes, permitindo
uma interação completa. Para isto, é importante manter o toque humano, pois o
componente do contato é importante para o CRM.
Newell (2000) também afirma que há alguns ensinamentos da relação entre
tecnologia e CRM que devem ser sempre lembrados. Os profissionais de CRM
precisam estar atentos às novas tecnologias, pois os avanços digitais de
amanhã colocarão os dados do cliente nas mãos de todos. As empresas
devem ser capazes de adivinhar o que o cliente quer antes mesmo dele saber.
Para isso será necessário um gerenciamento criativo para desenvolver o CRM
27
mais valioso ao cliente. Ao adotar novas tecnologias, a empresa deve sempre
tentar responder a três perguntas:
a. Por que adotá-la?
b. Qual é a promessa para o cliente?
c. O que se quer que ela faça?
Neste ambiente de constantes mudanças tecnológicas, a capacidade de
aprender mais rápido do que seu concorrente será a única vantagem
sustentável. E para isto o feedback ao cliente terá um papel fundamental.
II.2. EXTRAÇÃO DO CONHECIMENTO
II.2.1. O papel dos bancos de dados (database marketing)
Segundo Ha e Park (1998), database marketing é um processo de marketing
voltado para a informação. Gerenciado através de tecnologias de bancos de
dados, ele proporciona aos profissionais de marketing a possibilidade de
desenvolverem, testarem, implementarem, medirem e modificarem programas
e estratégias de marketing personalizado. Alguns dos efeitos do database
marketing são:
a. Conhecer mais sobre os vários tipos de clientes da companhia, e
determinar a possibilidade deles comprarem ou não determinados
produtos ou serviços;
b. Facilitar o alcance dos clientes com produtos e ofertas certas, no
momento certo;
c. Permitir a atualização contínua da informação no banco de dados,
possibilitando o desenvolvimento de futuras estratégias de marketing
baseadas nos resultados das campanhas anteriores;
28
d. Ajudar a desenvolver serviços que aumentem a possibilidade dos clientes
comprarem mais, e a estabelecer uma comunicação bilateral com o
cliente através de uma variedade de canais de contatos.
Jackson e Wang (1994) afirmam que o ambiente atual dificulta a interação
entre as firmas e seus clientes, e que a utilização de novas tecnologias em
busca de informações sobre os clientes pode ser uma solução. Segundo os
autores, a propaganda através dos meios de comunicação está mais cara e
mais ineficiente, pois não permite que a empresa fale especificamente com seu
público alvo. Dentro deste cenário, as empresas devem descobrir novos meios
de se comunicarem diretamente com seus clientes. A utilização da informação
obtida através dos bancos de dados é uma alternativa.
Os autores listam uma série de benefícios provenientes da utilização de
bancos de dados:
a. Identificar quais são os seus melhores clientes;
b. Desenvolver novos clientes;
c. Enviar uma informação consistente com o seu produto e seus clientes;
d. Reforçar as decisões de compras de seus consumidores;
e. Promover a venda cruzada e a venda complementar de produtos;
f. Melhorar a comunicação com os clientes;
g. Melhorar as promoções de vendas;
h. Refinar o processo de marketing;
i. Aumentar a eficácia dos canais de distribuição de marketing;
j. Manter o poder da marca;
k. Estabelecer uma administração de recursos;
l. Se comunicar sigilosamente com seus clientes;
m. Conduzir pesquisas de marketing, produtos e clientes;
29
n. Personalizar o serviço ao consumidor;
o. Promover a sinergia e a integração de programas.
Peppard (2000) também ressalta a importância das informações contidas em
bancos de dados. Para o autor, com as informações dos clientes, as firmas
devem ser capazes de: entender suas necessidades, diferenciá-los através da
segmentação, prever a possibilidade da sua perda e realizar análises sobre sua
lealdade, lucratividade e rentabilidade, sobre rentabilidade e eficácia dos canais
e sobre performance das campanhas de vendas.
Sanders e Mertzer (2001) também enumeram as vantagens de se ter
informações guardadas em um data warehouse. Segundo o autor, para
conseguir reter seus clientes as empresas devem saber responder à seguinte
pergunta: quais os produtos, ou serviços, que devem ser oferecidos, para quais
grupos de clientes, através de quais canais de distribuição, de modo que
maximize o lucro? O data warehouse ajuda a responder estas perguntas
fornecendo informação sobre quem são os seus clientes (permitindo servir-lhes
melhor) e sobre de onde vem os maiores lucros da empresa (permitindo
maximizá-los). O data warehouse permite guardar informações como os nomes
e os endereços dos clientes. Com estes dados é possível tratá-los os clientes
como indivíduos, identificando quais os produtos que eles compram da
empresa, e até diferenciando os membros de uma mesma família.
Para demonstrar as oportunidades que a utilização de bancos de dados
oferece, Kish (2000) utiliza o exemplo das instituições financeiras. A cada ano
os bancos perdem entre 15 e 25 por cento de seus clientes e são obrigados a
gastar milhões de dólares para reconquistá-los e recrutar novos clientes. Por
isso, é hora dos bancos desenvolverem estratégias mais agressivas para
acabar com o descontentamento, principalmente entre os clientes mais
valiosos, criando programas de administração do atrito baseados em novas
tecnologias. A utilização de banco de dados possibilitaria às instituições
financeiras mapearem e interpretarem o mais acurado indicador de
probabilidade de deserção: a inatividade dos clientes. Através dos bancos de
dados, as instituições seriam capazes de:
30
a. Obter informação continuamente de todos os canais de comunicação que
os clientes uti lizam para interagir com os bancos;
b. Criar um perfil atual para cada cliente que sirva de base para cada
comportamento individual normal;
c. Monitorar e interpretar a atividade e a i natividade dos clientes;
d. Reconhecer quando o comportamento de um cliente mudar, indicando
um momento de risco;
e. Comparar as mudanças de comportamento individual, histórico e
característico, para reconhecer níveis de risco e determinar as respostas
apropriadas;
f. Avisar continuamente quem são os clientes em risco e os seus perfis;
g. Responder em tempo real sempre que necessário, tanto nas ameaças
quanto nas oportunidades.
Implantando estes programas, os bancos seriam capazes de detectar os
clientes que exibem comportamento de risco, permitindo que atitudes sejam
tomadas antes da deserção acontecer. Estas tecnologias são eficazes pois
vêem os clientes como indivíduos e conhecem seu comportamento normal,
detectando qualquer período de inatividade. Em 30 dias é possível para uma
instituição financeira criar um perfil do consumidor que reflita suas rotinas
regulares, suas preferências e características (tudo isto através de padrões
históricos).
Para construir o banco de dados, um passo fundamental é a obtenção dos
dados. Davids (1999) afirma que as empresas devem aproveitar todas as
interações com os clientes para obter novas informações. Pine II, Peppers e
Rogers (1995) afirmam que há varias maneiras de se obter informação sobre
seus clientes, entre elas: quiosques, serviços on-line e correspondência. É
importante que a empresa tenha consciência de que o gosto dos clientes não é
estático, podendo variar com o passar de tempo, e, por isso, qualquer contato
com o cliente deve servir como fonte de novas informações.
31
Segundo Berson, Smith e Thearling (1999), há três tipos de dados sobre os
clientes que interessam às organizações:
a. Descritivos – Tentam responder a seguinte pergunta: quem é o cliente?
Os dados descritivos não variam muito e podem ser atualizados
trimestralmente ou semestralmente;
b. Promocionais – Tentam responder a seguinte pergunta: o que foi feito
com o cliente? A obtenção destes dados depende da sofisticação do
sistema CRM;
c. Transacional – Tentam responder a seguinte pergunta: como o cliente
reagiu às promoções? Estes dados variam muito e precisam ser
continuamente coletados.
Um grupo de dados que tem sido muito trabalhado para detectar o padrão
de consumo de clientes são as variáveis RFM (recency, frequency, monetary).
Ha e Park (1998), que as uti lizou no seu trabalho, explica cada um dos termos
do RFM:
d. Recência (recency) – Mede o período de tempo decorrido desde a última
compra realizada pelo cliente;
e. Freqüência (frequency) – Mede o número de compras feito pelo cliente
em um determinado período de tempo;
f. Valor monetário (monetary) – Mede o volume monetário gasto pelo
cliente durante um certo período de tempo.
Hughes (1996) complementa, afirmando que a grande vantagem do RFM é a
sua facilidade de implementação. Comparando a segmentação demográfica
(que fornece informações sobre quem são os clientes) com o RFM (que
fornece informações sobre o que eles fazem), este último apresenta resultados
melhores pois, quando se faz uma campanha de marketing, o objetivo final é
descobrir o que seus clientes irão fazer, e não quem eles são.
32
Newell (2000) também ressalta a importância do controle do valor financeiro,
da freqüência e da recência das compras feitas pelos clientes. Entretanto, para
o autor, estes dados devem ser utilizados de uma forma diferente, visando
entender melhor o que um cliente valorizará em um relacionamento com sua
empresa. Para isto, não bastam só as ferramentas, é necessário e importante
desenvolver ou contratar os profissionais certos.
O autor também lembra a importância da privacidade na construção de um
relacionamento baseado em confiança. Em geral, as pessoas temem o que não
entendem, e não sabem muito sobre database marketing. Por isso os
relacionamentos devem ser construídos com base na confiança. A informação
sobre os clientes é um combustível para os negócios, sendo necessária uma
atenção enorme para evitar vazamentos de informação.
Pine II, Peppers e Rogers (1995) concordam sobre a importância da questão
ética e da privacidade que os clientes merecem. Dada a importância de um
banco de dados, ele deve ser considerado um ativo muito valioso, e que por
isso não deve ser negociado.
Berson, Smith e Thearling (1999) também afirmam que a privacidade é uma
questão importante na política de obtenção e tratamento dos dados dos
clientes. Como ainda não há leis para todos os casos envolvendo a questão da
privacidade em banco de dados, as empresas devem ser cautelosas, evitando
tomar atitudes que possam trazer problemas no futuro. Para evitar problemas
com privacidade algumas sugestões são:
a. Tentar manter o anonimato e a identidade dos clientes – Deve-se evitar a
associação dos dados com o nome ou o número de identidade do cliente;
b. Trabalhar com dados consolidados, em vez de detalhados – Muitas
vezes para se obter o mesmo resultado não é necessário trabalhar com
dados individualizados, podendo-se agrupar os dados de uma
determinada variável.
c. Usar a informação somente para medir e não para manipular o
comportamento do cliente – Apesar de ser difícil determinar até onde vai
33
a medição e a partir de que momento começa a manipulação, os clientes
aceitam quando percebem que a informação é utilizada para
complementar as suas vidas. Contudo, eles não gostam quando acham
que estão sendo manipulados.
II.2.2. Definição de Data Mining
Segundo Ha e Park (1998), o termo data mining tem significados diferentes
na academia e no mundo de negócios. Na academia o data mining é somente
uma etapa no processo de procura de padrão nos dados, enquanto que no
mercado ele é visto como todo o processo de descoberta de conhecimento.
Pode-se verificar esta confusão comparando a definição de diversos autores
para o termo data mining. Entre os autores que utilizam a definição de
mercado, pode-se citar: Data Distilleries (2000), Ha e Park (1998), Newell
(2000) e Taurion (2001).
“Data mining é a descoberta de conhecimento interessante, mas escondido em grandes bases de dados. Bases de dados corporativas
freqüentemente contêm tendências desconhecidas, relações entre objetos, como clientes e produtos, que são de importância estratégica para a organização.” (Data Distilleries, 2001, p. 8).
“Data mining, que também é conhecido como descoberta de conhecimento em banco de dados, é uma ciência emergente que aplica
tecnologias modernas de estatística e inteligência artificial ao problema de extração de informações válidas, previamente desconhecidas, compreensíveis e passíveis de ação contidas em bancos de dados e
utiliza-as na tomada de decisões cruciais para os negócios.”5 (Ha e Park, 1998, p. 1).
“O processo de extrair informações a partir de dados é o que chamamos de data mining. (...) O data mining é a descoberta de conhecimento.” (Newell, 2000, p. 121 e p. 126)
“Tecnologia data mining é o conjunto de ferramentas que permitem manipulações e análises estatísticas em cima de bases de dados,
buscando extrair e identificar relacionamento entre estes dados. (...) Uma ferramenta de data mining pode ser uma arma poderosa para extração de informações úteis perdidas em toneladas de dados aparentemente sem
relacionamentos entre si. E por outro lado, um uso incorreto desta
5 Tradução livre do autor deste projeto.
34
tecnologia pode gerar muito mais confusão, levando a empresa a tomar
decisões erradas.” (Taurion, 2001a, p.1).
Já entre os autores que preferem a definição acadêmica, pode-se citar:
Berson, Smith e Thearling (1999) e Saarenvirta (1998).
"Data mining, em uma definição simples, automatiza a detecção de
padrões relevantes em um banco de dados. (...) Data mining utiliza técnicas bem estabelecidas de estatística e de aprendizado de máquinas
para construir modelos que prevêem o comportamento do consumidor.”6 (Berson, Smith e Thearling, 1999, p. 6).
“Um processo que as companhias podem usar para transformar seus
dados operacionais em informação úteis no processo de decisão é o data mining. Este processo, utilizando ferramentas avançadas de inteligência
artificial e de machine-learning, pode aumentar a lucratividade corporativa através da redução dos custos e do aumento das receitas.”7 (Saarenvirta, 1998, p.9).
Data mining pode ser entendido melhor através da analogia da mineração
feita por Berson, Smith e Thearling (1999): há uma montanha de dados (data
warehouse) e o objetivo é achar as pedras preciosas (informações relevantes)
nesta montanha, as ferramentas de data mining ajudam nesta mineração da
informação.
Observando todas as definições, pode não ficar claro a diferença entre o
data mining e a estatística. Segundo a consultoria Data Distilleries (2001),
apesar do data mining utilizar técnicas estatísticas e de machine-learning, ele
difere de técnicas estatísticas porque, ao invés de verificar padrões hipotéticos,
utiliza os próprios dados para descobrir tais padrões. O data mining explora as
bases de dados através de dezenas de centenas de pontos de vista diferentes.
Berson, Smith e Thearling (1999) afirmam que o data mining não é somente
estatística. Analisar dados para melhor entender um negócio é uma tarefa que
já vem sendo feita há muito tempo, entretanto o data mining viabiliza esta
análise quando o volume de dados é muito grande. As principais vantagens do
data mining em relação à estatística são: a facilidade de utilização pelas
6 Tradução livre do autor deste projeto.
7 Tradução livre do autor deste projeto.
35
pessoas de negócios, não precisando ser estatístico para entendê-lo, e o fim
da necessidade dos dados circularem entre os diversos departamentos da
firma antes de serem convertidos em informação. Apesar da estatística e do
data mining serem técnicas que possuem os mesmos objetivos e utilizam a
mesma base para alcançá-los (os dados), o data mining é mais robusto e por
isso pode ser utilizado por pessoas não experts.
II.2.3. Benefícios do Data Mining
O primeiro grande benefício do data mining é o acesso à informação.
Berson, Smith e Thearling (1999) constatam que o data mining pode revelar
informações que os usuários não desconfiavam que existissem. Para os
autores há duas maneiras possíveis de lidar com essas informações: aceitá-las
como uma caixa preta ou questioná-las. Entretanto, somente através do
questionamento que se consegue compreendê-las, e o data mining ajuda nesta
tarefa.
Para Data Distilleries (2001), graças à tecnologia da informação a empresa
consegue diferenciar: os seus dados, as suas análises, a interação com os
clientes e a sua produção. E o data mining ajuda nesta diferenciação e ainda
tem as seguintes vantagens:
a. Os modelos são de fácil compreensão;
b. As grandes bases de dados podem ser analisadas;
c. Informações que não se esperava podem ser descobertas;
d. As variáveis não necessitam ser preparadas;
e. Os modelos são precisos;
f. Os modelos são construídos rapidamente.
Esta busca por informações escondidas pode ser implementada em diversas
áreas da organização. Para Berson, Smith e Thearling (1999), as principais
áreas onde o data mining pode ser aplicado são:
36
a. Retenção de clientes;
b. Serviços de vendas e para clientes;
c. Marketing;
d. Detecção de fraudes e medição de risco;
Saarenvirta (1998) também identifica as principais oportunidades para a
utilização do data mining. Entre elas o autor cita:
a. Lucratividade e segmentação dos clientes;
b. Marketing dirigido;
c. Análise e separação de clientes;
d. Administração do risco de crédito;
e. Prevenção à fraudes e abusos;
f. Análises de vendas cruzadas;
g. Lucratividade de produtos e carteiras;
h. Serviço ao consumidor.
Como é possível perceber, muitas das aplicações estão voltadas para o
marketing e para o CRM. Isto acontece devido ao valor contido nestas novas
informações que podem ajudar a melhorar o relacionamento da companhia
com os seus clientes. Berson, Smith e Thearling (1999) afirmam que o mundo
de negócios está cada vez mais difícil para as empresas e, para conquistar
seus clientes elas precisarão fazer: a oferta certa, para a pessoa certa, no
momento certo e através do canal certo. O data mining é a ferramenta que
pode ajudar as organizações a melhorar esta interação com os seus clientes.
Analisando a utilização do data mining em programas de marketing e CRM,
o autores destacam os seguintes benefícios:
a. Aumento na receita;
37
b. Aumento dos lucros;
c. Diminuição dos custos;
d. Retorno sobre investimentos (ROI);
e. Criação de vantagem competitiva;
f. Pioneirismo ao se adotar uma nova tecnologia.
Já segundo Jackson e Wang (1994), o impacto da utilização e da integração
de bancos de dados na estratégia das empresas depende do estágio de
implementação. Há três estágios:
a. Dados históricos e sistemas de administração – É a utilização dos
bancos de dados de marketing que visam somente auxiliar programas de
correspondência com os consumidores. É considerado um uso passivo
dos bancos de dados.
b. Bases de dados como auxi lio à inteligência de marketing – O banco de
dados possui mais informações que no caso anterior. A empresa utiliza
os dados no auxi lio à tomada de decisões de marketing.
c. Fonte integrada de negócios – O banco de dados serve como guia para
todas as decisões da empresa, não somente as decisões de marketing.
O banco de dados interfere nas decisões referentes ao serviço aos
clientes, ao marketing, a vendas, à distribuição dos produtos, à pesquisa
e às finanças das empresas.
São muitas as maneiras de se conseguir estes benefícios da integração
entre data mining e CRM. Para Feldens e Reategui (2001), os benefícios do
data mining podem ser aplicados a três áreas: na relação das empresas com
seus clientes, no aumento das vendas e do faturamento e na identificação de
padrões de navegação e de perfis de usuários da internet.
Na relação das empresas com os seus clientes, o data mining atua na:
38
a. Redução de atrito - Um projeto de redução de atrito visa identificar
motivos de conflito com os clientes e definir ações para diminuição das
taxas de atrito;
b. Retenção através de downgrade - O princípio da retenção por downgrade
é o de identificar clientes que uti lizem produtos ou serviços da empresa
que estejam superdimensionados, e que por isso, têm tendência a
procurar produtos ou serviços da concorrência;
c. Prospecção de clientes qualificados - O principal objetivo da prospecção
de clientes qualificados é a conquista de novos clientes. Isto pode ser
alcançado através da identificação de perfis com alto potencial de
consumo e da criação de modelos que possam ser usados para
encontrar estes clientes em outras bases de dados.
No aumento de vendas e faturamento, o data mining auxilia no:
a. Projeto de cross-sales - O objetivo de um projeto de cross-sales é o de
realizar ofertas de produtos e serviços de forma personalizada a cada
cliente, aumentando a satisfação dos clientes e aproveitando
oportunidades de vendas cruzadas nos diferentes momentos de venda;
b. Projeto de up-sales - O objetivo de um projeto de up-sales é identificar
clientes com poder de consumo maior do que o demonstrado até então,
para que se possa criar e dirigir ações que visem o aumento de consumo
destes clientes.
Em relação à internet, o data mining permite a:
a. Identificação de perfis e padrões de navegação – Através da identificação
de perfis e padrões de navegação é possível personalizar o conteúdo, as
ofertas e a estrutura do web site de acordo com o perfi l do internauta.
Já segundo Berson, Smith e Thearling (1999), as principais aplicações do
data mining no CRM são:
39
a. Conquista de novos clientes – O data mining pode ajudar na tarefa da
seleção de público alvo para as campanhas de marketing. O data mining
ajuda a prever o comportamento de resposta dos clientes que seriam
atingidos pelo programa de marketing, possibilitando a empresa escolher
somente aqueles que têm maior probabilidade de responderem à sua
campanha;
b. Venda cruzada – Venda cruzada é o processo onde uma empresa
oferece aos seus clientes novos produtos e serviços, complementando os
seus desejos. O data mining atua prevendo o comportamento dos
clientes e detectando as oportunidades de vendas cruzadas as quais os
clientes têm maiores chances de responder;
c. Retenção de clientes – O data mining ajuda a detectar o comportamento
padrão dos clientes que abandonam a empresa. Com este modelo, a
companhia pode prever quando um cliente está pretendendo deixar de
fazer compras com ela, e atuar antes que esta perda seja consumada;
d. Segmentação – O data mining ajuda na segmentação dos clientes de
uma empresa. A segmentação permite que a firma analise sua base de
clientes por um nível mais alto. Só por trazer a tona o conceito de
diferenciação dos clientes, o processo de segmentação já é benéfico
para a empresa.
Apesar de todas os possíveis benefícios do data mining, nunca se deve
esquecer o aviso dado por Newel (2000). O autor alerta que o data mining
realmente permite que uma firma entenda melhor os dados que possui e assim
adquira novos conhecimentos. Contudo, um dos segredos do seu sucesso não
é a ferramenta em si, mas a habilidade e o poder da equipe que atua com as
estas informações no desafio empresarial do dia-a-dia.
II.2.4. Implementação e etapas do Data Mining
Um momento importantíssimo na determinação do sucesso de um projeto
data mining é a sua implementação. Para que ela seja perfeita, as companhias
40
devem conseguir integrar as três peças fundamentais citadas por Jackson e
Wang (1994). As três peças são: os dados, a tecnologia e as técnicas
estatísticas. Os dados servem de base para a obtenção da informação, que só
será relevante e confiável se eles forem de boa qualidade, a tecnologia viabiliza
todo o processo, e as técnicas quantitativas fazem a extração da informação.
Esta integração e a extração do conhecimento não são obtidas facilmente.
Diversos autores enumeram as diversas etapas que um projeto data mining
deve ter para garanti-las. Apesar de não haver uma concordância quanto ao
número de etapas, todos estão de acordo que a primeira é a análise da
contribuição que o data mining pode trazer para o negócio e a última deve ser
a aplicação e avaliação do conhecimento obtido.
Saarenvirta (1998) contabiliza seis etapas: análise do negócio, análise dos
dados necessários, implementação do projeto de data mining, aplicação nos
negócios e análise dos resultados. Sendo que, deve-se ter uma atenção
especial com:
a. A escolha do hardware de data warehouse;
b. O funcionamento do banco de dados e do data warehouse;
c. A escolha dos produtos de transformação do data warehouse;
d. As aplicações de data mining;
e. O treinamento de pessoal.
Para Berson, Smith e Thearling (1999), analisando-se somente o processo
de extração do conhecimento, o data mining é composto por seis etapas
(conforme mostrado na Figura 1): a obtenção dos dados, a seleção de um
subconjunto específico de dados, o pré-processamento dos dados, a
transformação dos dados, a aplicação dos modelos data mining para previsão
e a interpretação humana visando a extração do conhecimento.
41
Figura 1 Processo de extração de conhecimento
Estes mesmos autores afirmam que o contexto do negócio também tem um
papel importante antes da implementação do projeto. Este contexto deve estar
claro para as pessoas envolvidas pois caso contrário, a probabilidade de que
sejam cometidos erros aumenta. Esta visão mais holística e preocupada com
os negócios sobre data mining é representada na Figura 2.
Figura 2 Visão holística do processo data mining
Dados
Subconjunto
específico de dados
Modelos de previsão
Dados formatados
Conhecimento
Dados pré-
processados
Seleção
Pré-processamento
Transformação
Data mining
Interpretação humana
Data mining
Problema do negócio
Definição de ROI (retorno sobre
investimento)
ROI
ROI previsto
Definição de valor
Definição de valor
Dados
Definição dos dados
Modelos de previsão
Entender
Aplicação
Desenvolver
42
Já Ha e Park (1998) descrevem o data mining como um processo interativo
e iterativo, composto por nove etapas:
a. Desenvolvimento e entendimento do domínio da aplicação e dos
objetivos dos usuários finais;
b. Criação de um grupo de dados alvo, selecionando um subgrupo ou
focando em um subgrupo de variáveis onde o processo de descoberta
será realizado.
c. Pré-processamento e limpeza dos dados, envolvendo basicamente:
remoção de dados espúrios ou outliers e gerenciamento de missing
values.
d. Transformação e redução dos dados;
e. Escolha das técnicas a serem realizadas no processo data mining, entre
elas: descoberta de regras associativas, clusterização, classificação,
seqüenciamento e previsão;
f. Escolha dos algoritmos, selecionando os métodos, os modelos e os
parâmetros;
g. Procura por padrões;
h. Interpretação dos resultados obtidos nas etapas anteriores e possível
retorno a uma destas etapas;
i. Consolidação do conhecimento descoberto, incorporando este
conhecimento no sistema ou documentando-o.
E por último, Hui e Jha (2000) afirmam que o processo de implementação do
data mining contém sete passos:
a. Estabelecimento das metas do data mining – É o conhecimento do
negócio da empresa;
b. Seleção dos dados – É a identificação do grupo de variáveis onde o data
mining será aplicado;
43
c. Pré-processamento dos dados – É a remoção das impurezas dos dados
(dados incorretos ou desnecessários);
d. Transformação dos dados – É a alteração do formato dos dados, já que
muitas vezes eles estão armazenados de formas incompatíveis com as
utilizadas no data mining;
e. Data warehousing – É o processo de ter a visão, planejar, construir, usar,
gerenciar, manter e expandir os bancos de dados;
f. Data mining – Inclui as funções de resumo, associação, classificação,
previsão e clusterização;
g. Avaliação dos resultados – É a aplicação dos resultados no negócio da
empresa.
Dentro da etapa que muitos autores chamam de data mining ou descoberta
de padrões, um procedimento essencial é a realização das previsões ou
pontuação dos clientes. Berson, Smith e Thearling (1999) alertam que, na
verdade, a previsão é o objetivo final do data mining. Normalmente este
processo consiste em: identificação de um segmento interessante, pontuação
dos clientes através do modelo de previsão, ordenação segundo a pontuação,
escolha dos primeiro da classificação e envio destes selecionados para o
departamento de marketing. Para minimizar os erros nesta etapa, os autores
sugerem que as companhias devem se assegurar que:
a. A definição de segmentação está correta e que os clientes certos foram
selecionados para a pontuação;
b. Os clientes certos foram pontuados;
c. O modelo correto foi utilizado;
d. A pontuação foi colocada no local correto dentro da base de dados;
e. A forma como a pontuação deve ser ordenada foi entendida.
O primeiro passo necessário para que este processo de previsão seja bem
feito é a preparação dos dados, devendo-se verificar a consistência entre os
44
dados históricos e os que serão utilizados como previsores. Em seguida, deve-
se mapear as variáveis que serão utilizadas como previsores, já que nem todas
serão uti lizadas. Há variáveis diretas, que são as mesmas que foram utilizadas
na base histórica, e as que necessitam de ajustes (nesta categoria se
enquadram as variáveis temporais, pois a cada mês é preciso alterar o mês da
variável utilizada). O último passo importante neste processo de pontuação dos
clientes é integrar o resultado da pontuação nas diversas aplicações da
empresa.
Mesmo estando cientes de todas as etapas que um projeto data mining deve
conter, a implementação nem sempre é uma tarefa tranqüila. Visando ajudar as
empresas, Berson, Smith e Thearling (1999) apontam dez passos que devem
ser seguidos na implementação, pois facilitam a obtenção do sucesso final:
a. Definir o problema – É importante definir onde ele será aplicado e como
as metas serão atingidas. Facilita muito esta etapa se o projeto for bem
focado e pequeno, mas é necessário que seja algo importante para o
negócio e que por trás de tudo esteja a filosofia CRM;
b. Definir o usuário – É importante saber quem será o usuário final, para
que não ocorra um dos dois erros mais comuns: sistemas complexos
demais para usuários não sofisticados, ou sistemas muito básicos para
usuários sofisticados. Sabendo o perfil do usuário final será possível
fornecer um sistema com o nível ótimo de sofisticação;
c. Definir os dados – Não adianta o quão sofisticado é o programa se os
dados não forem de boa qualidade. Acima de tudo, funciona a lei:
Garbage In, Garbage Out (entra lixo, sai lixo). Para manter a qualidade
dos dados é importante ter um local onde fiquem anotadas todas as
características, descrições e alterações do banco de dados;
d. Definir a integridade dos dados – É importante verificar a integridade dos
dados que foram obtidos. Isto pode ser feito comparando as diferentes
fontes de dados;
45
e. Definir o escopo do projeto – O projeto não deve perder o foco e crescer
para áreas para o qual não foi planejado. Uma maneira de se evitar isto é
criando um documento que deixe bem claro o escopo do projeto;
f. Testar – Deve-se lançar um programa de teste pequeno e que dê
liberdade aos usuários finais deve ser lançado;
g. Garantir a segurança – Muitas pessoas não confiam nas novas
tecnologias. Por isso, é necessário um programa que assegure a
qualidade do projeto. Este programa deve funcionar tanto internamente,
conferindo os resultados, como externamente, fazendo propaganda e
diminuindo a tecnofobia dentro da empresa;
h. Educar – Os usuários finais devem ser treinados para se familiarizarem
com a nova tecnologia;
i. Lançar – O lançamento só deve ser realizado após se ter certeza de que
não há erros no programa. Os usuários iniciais devem ser escolhidos
cuidadosamente, e não se deve relaxar enquanto os resultados não
aparecerem. Nesta etapa de lançamento, é importante ajudar os usuários
a entenderem e interpretarem os resultados;
j. Continuar – O processo não pode ser encarado como pontual. Novos
modelos precisarão ser criados, os velhos deverão ser arquivados e a
performance precisará ser medida continuamente.
Seguindo estas etapas, as organizações conseguem diminuir os principais
custos de um projeto data mining citados por estes mesmos autores:
a. Aquisição de dados;
b. Infraestrutura física – Computadores, data warehouse, software de data
mining e difusão dos resultados através da empresa;
c. Pessoal – Data miner, Web designer, data designer, gerente de projetos,
interface com o marketing e interface com o banco de dados;
46
d. Custos de manutenção – Software, hardware, atualizações de dados,
teste, criação de novos modelos data mining, desenvolvimento dos
modelos atuais e validação dos modelos.
II.2.5. Data Warehouse
Como pôde ser visto, um componente importante no data mining é o data
warehouse. Para Taurion (2001a), o data warehouse é essencial pois integra
dados de múltiplas fontes e assegura a qualidade dos dados que serão
garimpados. E este é um aspecto importante pois, se a base de dados não for
válida, não será extraída nenhuma informação útil.
Ha e Park (1998) definem data warehouse como uma coleção de dados
orientada para sujeitos, integrada, variante no tempo e não volátil, uti lizada no
suporte do processo de tomada de decisão. Ele é orientado para sujeitos pois é
realmente voltado para: clientes, vendedores, produtos e atividades da
empresa. É integrado pois os dados armazenados são provenientes de
múltiplas fontes que se encontram no ambiente operacional. É variante no
tempo devido a três características: a base contém dados históricos e não
somente de um momento específico, cada dado é associado a uma data
específica (dia, mês ou ano) e os dados nunca são atualizados (quando são
armazenados pela primeira vez, eles já devem estar com o valor correto). O
data warehouse é não volátil pois só há duas operações que podem ser feitas:
carregamento inicial dos dados e o acesso aos dados, não há atualização.
Berson, Smith e Thearling (1999) observam que as empresas possuem
dados operacionais e dados informativos. Os primeiros refletem a situação
atual da operação, sendo atualizado constantemente. Os dados informativos
servem para tomada de decisão e por isso precisam conter informações
históricas e não precisam ser tão ágeis quanto os dados operacionais. O local
onde as empresas guardam estes dados é o data warehouse, e suas principais
características são:
a. É uma base de dados desenhada para tarefas analíticas;
47
b. Suporta um número relativamente pequeno de usuários com longas
interações;
c. É voltada para a leitura intensiva;
d. É atualizada periodicamente;
e. Contém dados atuais e históricos;
f. Contém poucas tabelas, mas que guardam um grande volume de dados;
g. Cada pesquisa resulta em um amplo conjunto de resultados.
O funcionamento e a arquitetura básica do data warehouse, segundo os
autores, estão ilustrados na Figura 3. Os componentes desta arquitetura são:
Figura 3 Arquitetura do data warehouse
a. Banco de dados data warehouse (número 3 na Figura 3) – É onde os
dados ficam armazenados. Existem diversas tecnologias de
implementação;
Extrair,
Limpar e
Carregar
os Dados
Metadata
Data Warehouse
DBMS Data
Marts
Plataforma de gerenciamento
Dados
Externos e Operacionais
Plataforma de
Administração Repositório
Ferramentas e
Aplicações
Reports, EIS,
Consultas e Ferramentas
Ferramentas
OLAP
Ferramentas
Data Mining
Sistema de entrega de
informação
4
5
3
7 6
1
2
48
b. Ferramentas para alimentação, aquisição, limpeza e transformação dos
dados (número 1 na Figura 3) – Faz todas as conversões, resumos,
mudanças chaves, mudanças estruturais e condensações necessárias
para transformar dados díspares em informação relevante;
c. Metadata – Metadata são os dados que descrevem o data warehouse:
são os dados sobre os dados. O metadata fornece acesso interativo aos
usuários, ajudando no entendimento do conteúdo e na localização dos
dados. O gerenciamento do metadata é feito pelo repositório metadata
(número 2 na Figura 3).
d. Ferramentas de acesso (números 5 e 7 na Figura 3) – É onde os
usuários interagem com o data warehouse e obtêm as informações. Uma
das questões mais importante está no acesso e na visualização dos
dados. Há cinco tipos de ferramentas principais: procura de dados e
ferramentas para relatórios; ferramentas de desenvolvimento de
aplicações; ferramentas executive information system (EIS); on-line
analytical processing tools (OLAP) e ferramentas data mining.
e. Data marts (número 4 na Figura 3) – Data marts são bancos de dados
subsidiários ao data warehouse. Muitas pessoas pensam que eles
podem ser uma alternativa menor e mais barata ao data warehouse,
entretanto, eles não comportam o mesmo volume de dados.
f. Administração e gerenciamento do data warehouse (6) – O
gerenciamento do data warehouse inclui: segurança e gerenciamento de
prioridades; monitoramento das atualizações; conferência da qualidade
dos dados; gerenciamento e atualização do metadata; auditoria e
relatórios sobre a utilização e o status do data warehouse; apagamento
de dados; replicação, distribuição e agrupamento de dados; backup e
recuperação de dados; e gerenciamento do data warehouse.
Para os autores, a internet proporciona uma expansão na capacidade de
acesso a um data warehouse, já que o usuário final não precisa ter o seu
próprio banco de dados.
49
Ha e Park (1998) dividem a estrutura do data warehouse em: dados
correntes, dados antigos, dados rapidamente resumidos, dados extremamente
resumidos e metadata, Os dados correntes refletem as transações mais
recentes, eles são mais volumosos pois são estocados com o mais baixo nível
de granularidade. Os dados antigos não são acessados freqüentemente. Os
dados rapidamente resumidos são provenientes dos dados correntes. Os
dados extremamente resumidos são mais resumidos e compactos que os
dados rapidamente resumidos. O metadata contém a estrutura dos dados, os
algoritmos utilizados nos resumos e o fluxo de dados do ambiente operacional
para o data warehouse. Como via de regra, quanto mais resumido o dado, mais
ele é utilizado devido à rapidez e à eficiência do acesso.
Normalmente os dados saem do data warehouse e vão para os
departamento que os utilizam de maneira customizada para a tomada de
decisão. O local dentro destes departamentos onde os dados ficam guardados
é chamado de data marts. Há várias vantagens organizacionais, tecnológicas e
econômicas na uti lização de data marts, sendo que elas se tornam mais
atrativas à medida que o data warehouse cresce em volume:
a. Quando um departamento utiliza o seu próprio data mart, ele pode
personalizar o fluxo de dados vindo do data warehouse. Ele pode utilizar
os dados sem se preocupar com o reflexo nas outras áreas da empresa;
b. O departamento pode selecionar um período histórico muito menor do
que se o encontrado no data warehouse;
c. O departamento pode selecionar softwares personalizados para o seu
data mart;
d. O custo unitário de processamento e armazenagem nas máquinas do
data mart é menor do que no data warehouse.
II.2.6. Objetivos,aplicações e técnicas de Data Mining
Tanto Berson, Smith e Thearling (1999) e Ha e Park (1998) concordam que
os principais objetivos do data mining são a descoberta e a previsão. Ha e Park
50
(1998) explicam mais detalhadamente que existem duas formas de data
mining: o voltado para verificação (testando hipóteses formuladas pelos
usuários) e o voltado para descoberta (extraindo informação automaticamente
dos dados). Sendo que, no data mining voltado para descoberta há dois
objetivos principais: a previsão e a descrição.
Os diversos autores também concordam quando falam das principais
aplicações do data mining. Continuando a explicar os objetivo, Ha e Park
(1998) citam as quatro principais aplicações do data mining, sendo que as duas
primeiras são descritivas e as duas últimas para previsão:
a. Regras de associação – São da forma X Y (se X, então Y), onde X e Y
são frases sobre valores de atributos do banco de dados.
b. Clusterização – Também conhecido como segmentação. Divide a base
de dados em um conjunto finito de grupos ou clusters onde cada variável
possui características similares;
c. Classificação – Se refere à descoberta de padrões de previsão para
classes. Existem dois tipos de métodos de classificação: as árvores de
classificação e os classificadores Bayesianos;
d. Previsão - Utiliza dados históricos para formular modelos cujos objetivos
é prever o comportamento futuro.
Entre as quatro principais aplicações do data mining citadas por Saarenvirta
(1998) duas coincidem com as de Ha e Park (1998):
a. Previsão – Utilizam dados históricos para prever o consumo dos clientes,
as respostas às promoções, a lucratividade e o risco. O desempenho dos
modelos depende de quais os dados históricos estão disponíveis;
b. Clusterização – Classifica os clientes em grupos homogêneos de acordo
com seus atributos;
51
c. Segmentação – Cria segmentos de clientes definidos pela separação
máxima de um atributo em particular, que pode ser: a lucratividade, o
risco, o valor ao longo do tempo e a resposta às promoções;
d. Análise de afinidades – É a identificação de padrões, desconhecidos ou
conhecidos, que existem em um grupo de itens. Os grupos de itens
normalmente incluem a cesta de compras e as contas dos clientes. Os
padrões a serem descobertos podem ser: a combinação de produtos, a
seqüência de produtos e séries temporais similares.
Já Newell (2000) afirma que são seis as aplicações do data mining. A grande
diferença é que este autor separa a previsão em regressão e séries temporais:
a. Classificação – Utiliza os dados para identificar o padrão que caracteriza
um grupo de clientes;
b. Regressão – Utiliza os dados atuais para prever o comportamento futuro;
c. Séries temporais – Semelhante à regressão, mas utiliza dados temporais;
d. Análise por conglomerados – Procura por grupos de clientes que tenham
comportamentos distintos ou semelhantes;
e. Análise de associações – Tenta descobrir ações dos clientes que
ocorram de forma conjunta;
f. Descoberta seqüencial – Tenta descobrir ações dos clientes que ocorram
de forma seqüencial.
Os métodos para por em prática estas aplicações são muitos. Ha e Park
(1998) enumeram cinco:
a. Árvores de decisão e regras;
b. Regressão não linear e métodos de classificação;
c. Métodos baseados em exemplos;
d. Modelos de dependência probabilística;
52
e. Modelos de aprendizagem relacional.
Berson, Smith e Thearling (1999) dividem os métodos em dois grupos em
função da data de criação e da aceitação: os métodos clássicos e os recentes.
São três os clássicos:
a. Estatística –A estatística tenta responder a perguntas sobre que padrões
existem, qual a probabilidade deles ocorrerem, eles são significativos e
como resumir as informações contidas no banco de dados. As principais
ferramentas estatísticas são os histogramas e as regressões;
b. Nearest neighbor – Esta técnica faz previsões através da semelhança de
um dado com os seus vizinhos;
c. Clusterização – Esta técnica tenta agrupar os dados segundo suas
semelhanças, não havendo como comparar se os grupos formados estão
corretos ou não. Como não há como saber o número ideal de grupos,
sempre há o trade-off entre múltiplos grupos (tendendo no limite para
grupos de um só elemento) e poucos grupos (tendendo no limite para
apenas um grupo com todos os elementos).
Também são três as técnicas recentes:
a. Árvore de decisão – Na árvore de decisão cada galho da árvore é uma
pergunta que classifica os dados e os divide pelas folhas, sem que
nenhum seja perdido. Por isso, a árvore de decisão pode ser vista como
uma segmentação nos dados. A grande vantagem desta técnica é a sua
facilidade de compreensão pelo usuário. Ela pode ser utilizada para
explorar os dados e para fazer previsões. O primeiro passo é fazer o
crescimento da árvore, para isso deve-se fazer as melhores perguntas
possíveis em cada galho O segundo passo para a implementação é
decidir quando parar com a árvore, havendo três condições que indiquem
este momento: quando o segmento só contém um dado, quando todos os
elementos do segmento possuem características semelhantes e quando
a melhora a ser obtida não justifica a pergunta. Árvores muito grandes e
detalhadas correm o risco de cometerem o erro do overfitting;
53
b. Redes neurais – São as vedetes do data mining. As redes neurais
aprendem os padrão através da apresentação dos dados, mas esta
característica do aprendizado não significa que ela seja muito melhor que
as técnicas tradicionais. Há uma crença de que as redes neurais podem
ser deixadas trabalhando sozinhas e que por isso não dão muito
trabalho. Isto não é verdade, e na realidade elas não são muito fáceis de
serem utilizadas. As redes neurais têm um poder de previsão muito alto,
mas uti lizam modelos que são muito difíceis de serem entendidos e
explicados. Assim sendo, os sistemas que implementam redes neurais
ou já vêm fechados (oferecendo a solução completa para um
determinado problema) ou precisam do acompanhamento de um expert
(o que elimina uma das vantagens do data mining que é a fácil
utilização). Redes neurais podem ser utilizadas para clusterização,
análise de outliers e para análise de componentes principais (redução da
dimensão de variáveis). O excesso de treinamento da rede pode levar ao
overfitting. A principal crítica à rede neural é a dificuldade de
entendimento do modelo, e por isso, muito esforço tem sido gasto para
tentar entender melhor os modelos criados.
c. Indução de regras – Esta é possivelmente a técnica mais associada ao
data mining. Através da indução de regras, tenta-se extrair todos os
padrões contidos nos dados. Um dos problemas desta técnica é
exatamente o excesso de padrões que podem ser extraídos. As regras
são da seguinte forma “se isto e isto e isto, então isto”. Existem dois tipos
de informação que verificam a relevância da regra obtida: a exatidão
(com que freqüência a regra está correta – probabilidade condicional) e a
cobertura (com que freqüência a regra é aplicada – probabilidade de
eventos múltiplos). É importante sempre lembrar que a regra não implica
causalidade, ela simplesmente afirma que, nos dados, a ocorrência do
padrão é alta.
Os autores avisam que é difícil saber a priori qual a técnica de data mining
deve ser aplicada. Muitas vezes é necessário um processo de tentativa e erro.
54
Entretanto, as empresas não devem gastar muito tempo, pois a decisão pode
vir tarde demais devido à rapidez das mudanças no ambiente de negócios.
II.3. APLICAÇÕES REAIS DE TÉCNICAS DE EXTRAÇÃO DE
CONHECIMENTO
II.3.1. Descoberta do perfil dos clientes que não renovam o
contrato em uma empresa de telefonia celular
O primeiro exemplo utilizado é dado por Berson, Smith e Thearling (1999). O
exemplo ilustra o caso de uma empresa de telefonia celular que, através do
método da arvore de decisão, implementou um programa para detectar o perfil
dos clientes que mais abandonavam a empresa. A empresa inglesa possuía
uma base de 300.000 clientes e a taxa média de abandono na indústria era
maior que 40%. Neste exemplo, a aplicação do programa se restringiu aos
clientes não corporativos (260.000 clientes). O modelo foi aplicado para
segmentar os clientes conforme a probabilidade de abandono. Utilizou-se
dados de março de 1998 para prever o abandono dos clientes em abril de
1998. Foi implementado o CART (Classification and Regression Trees). O
modelo produzido possuía 29 segmentos, cada um correspondendo a uma
folha da árvore.
O Gráfico 5 ilustra o percentual acumulativo dos clientes versus o percentual
acumulativo de abandono. Fazendo uma amostragem aleatória dos clientes,
estes dois percentuais acumulativos devem ser iguais (linha cinza „Sem
estudo‟). Fazendo a segmentação dos clientes, é possível detectar uma parcela
pequena dos clientes que seja responsável pela maior parte dos abandonos
(linha preta „Com dados de maio de 1998‟). Através do estudo foi possível
detectar que:
a. Apenas 5,2% dos clientes eram responsáveis por 27,7% dos abandonos;
b. Apenas 10,5% dos clientes eram responsáveis por 41,5% dos
abandonos;
55
c. Apenas 19,7% dos clientes eram responsáveis por 55,8% dos
abandonos.
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Base de clientes (%)
Ab
an
do
no
(%
)
Sem estudo
Com dados de Maio de 1998
Gráfico 1 Percentual acumulativo dos clientes versus o percentual
acumulativo de abandono
A campanha de marketing direto foi direcionada para 101.003 clientes
(35,9% do total), um número considerado elevado. Os resultados apresentados
foram de certa forma surpreendentes. Enquanto que nos primeiros meses
ocorreu o esperado, uma diminuição na taxa de abandono, a partir do terceiro
mês o grupo que recebeu a campanha passou a apresentar uma taxa maior de
abandono. Acredita-se que a pressão feita pela campanha possa ter
antecipado a decisão de abandono de alguns clientes. Deste modo, como
sugestão para as próximas previsões, além de se levar em conta a
probabilidade de abandono, o modelo deve predizer a probabilidade do cliente
responder positivamente à campanha.
II.3.2. Segmentação de clientes de um shopping duty-free
O segundo exemplo utilizado é dado por Ha e Park (1998). O objetivo final
era aumentar o volume de vendas e a satisfação dos clientes de um shopping
56
duty-free. Clientes VIP seriam selecionado para o envio de promoções e
ofertas através de correspondência direta, e para isso, era preciso descobrir
quem eram estas pessoas. O banco de dados utilizado foi fornecido pelo
próprio shopping duty-free e continha dados POS (Point Of Sales) que eram
originários das transações de vendas. Trabalhou-se com os valores RFM
(recency, frequency, monetary) dos clientes.
Foi utilizado o Self-Organizing Map (SOM) para segmentar os clientes em
grupos de características similares do ponto de vista do RFM, e apontar cada
cliente para um dos grupos. A partir daí, seriam escolhidos alguns grupos
através do posicionamento estratégico de seus clientes, e estes receberiam a
correspondência direta. Os grupos de clientes também seriam utilizados para
classificá-los como leais ou vulneráveis, utilizando-se uma árvore de
classificação C4.5. Esta árvore faria a classificação utilizando os atributos RFM
e as classes já conhecidas (os clusters), produzindo algumas regras para esta
classificação.
A segmentação dos clientes começou com a extração dos dados. Foram
agrupados os clientes de todos os estandes usando as três variáveis RFM. O
primeiro passo foi a separação dos dados contendo: a identificação dos
clientes e as variáveis de recência, freqüência e valor monetário. Para trabalhar
com o SOM foi necessário padronizar o valor de todas as variáveis entre 0 e 1,
para que nenhuma tivesse um peso maior que as outras. A clusterização dos
clientes foi dividida em duas fases: o treinamento dos dados e o mapeamento
dos clientes. No treinamento foram utilizados 9 clusters. Este valor foi escolhido
pois cada variável RFM de entrada poderia ser dividida em duas categorias:
abaixo da média e acima da média. Assim sendo, os nove grupos são
suficientes para cobrir todas as oito possibilidades de combinações (2x2x2=8).
Após o treinamento, o SOM formou um mapa topológico utilizando os grupos.
O mapeamento dos clientes nos grupos refletia as similaridades existentes.
Após o mapeamento, foi possível saber quantos e quais clientes pertenciam a
cada grupo, assim como o seu valor médio das variáveis RFM.
57
Uma análise interessante foi a construção do gráfico que relaciona os
valores médios das variáveis RFM de cada grupo (Gráfico 2). Neste gráfico foi
possível posicionar cada grupo escolhendo duas das variáveis RFM (recência e
valor monetário), os valores médios de cada grupo puderam ser comparados
com os valores médios de todos os clientes. Utilizou-se o símbolo “seta para
cima” ( ) para indicar quando o valor era maior que a média e o símbolo “seta
para baixo” ( ) para indicar quando o valor era menor que a média.
Valor Monetário
Recê
ncia
(todos os grupos)
Gráfico 2 Posicionamento dos clusters quanto as variáveis RM
Entre os nove grupos, os que tiveram R F M foram selecionados como os
prioritários, seguidos pelos R F M e pelos R F M . O motivo da seleção
destes grupos foi a maior probabilidade da campanha de marketing direto obter
êxito. Os resultados finais, com o número de clientes, os valores médios das
variáveis RFM e a classificação dos grupos podem ser vistos na Tabela 1.
58
Tabela 1 Resultado final da segmentação de clientes
Cluster Número de
clientes Recência
média Freqüência
média Valor monetário
médio Outros
1 117 83,78 3,60 1.617,45 R F M
2 250 436,16 1,22 545,55 R F M
3 567 162,43 1,27 471,88 R F M
4 140 295,19 2,14 1.590,79 R F M
5 165 278,58 1,45 570,62 R F M
6 95 87,53 6,01 3.278,25 R F M
7 287 68,87 1,44 544.02 R F M
8 130 112,78 3,37 2.600,83 R F M
9 285 167,25 1,66 1.351,65 R F M
Média total 190,88 1,91 1.031,90
A próxima meta foi a classificação dos clientes como leais ou vulneráveis.
Para alcançar este objetivo, o processo foi dividido em três etapas: extração
dos dados, criação das árvores de decisão e obtenção das regras. Novamente,
os dados uti lizados foram as informações RFM, e as classes utilizadas foram
os 9 clusters criados pelo SOM. O treinamento da árvore foi feito com os 2.036
casos que foram utilizados no SOM. A partir das regras geradas, a
classificação poderia ser aplicada aos demais dados. O treinamento gerou 10
árvores, sendo que uma foi automaticamente selecionada como a melhor. Esta
árvore selecionada passou por um processo de simplificação, com o descarte
de um ou mais galhos. A partir destas árvores se fez a geração das regras.
Esta geração de regras pode utilizar mais de uma árvore, sendo que no
exemplo foram utilizadas todas as 10 árvores, pois esta foi a combinação que
apresentou a menor taxa de erro e o menor número de regras (81 regras). As
regras produzidas foram da forma E D (se E, então D), onde o lado
esquerdo E era uma conjunção de testes baseados nos atributos e o lado
direito D era uma classe. Junto com a regra apresentava-se a probabilidade
condicional de sua ocorrência.
Após o término deste trabalho, uma pergunta ficou sem ser respondida: qual
foi o efeito desta correspondência direta no aumento das vendas? Esta seria a
59
sugestão para novos trabalhos e para começá-la o primeiro desafio seria
projetar um meio de obter estas informações com os clientes.
II.3.3. Segmentação e detecção do perfil de compradores on-
line
O terceiro exemplo utilizado é dado por Vellido, Lisboa e Meehan (1998). O
objetivo deste estudo foi desenvolver uma segmentação exploratória no
mercado de compras on-line, que fornecesse algumas idéias sobre a sua
estrutura e a caracterização dos compradores on-line. Foi utilizado o Self-
Organizing Map (SOM) no processo de análise das variáveis e clusterização.
Os dados utilizados eram públicos e foram obtidos na Ninth GVU’s WWW User
Survey. Estes dados eram respostas à questionários sobre a internet. Foram
selecionados 44 itens das duas primeiras perguntas (opiniões gerais
comparando a compra on-line com as compras tradicionais e opinião dos
vendedores on-line comparadas com as outras formas de compras). A variável
dependente era binária por natureza, e correspondia se o respondente já fez ou
não compras on-line. Os 44 itens foram reduzidos para nove através de uma
análise de fatores. A Tabela 2 mostra os 5 fatores mais relevantes que foram
selecionados por um modelo chamado Automatic Relevance Determination. O
fator 2 (controle do risco) continha o maior poder de previsão. Em seguida
vieram os fatores 1 (compatibilidade) e 3 (poder financeiro). Finalmente, os
fatores selecionados menos relevantes foram o 4 (facilidade de uso) e 5
(esforço/taxa de resposta).
Tabela 2 Descrição e atributos dos 5 fatores selecionados
Fator Descrição Atributos
1 Experiência de compras: compatibilidade Controle e conveniência
2 Controle do risco por parte do cliente/ Controle de ambiente
Confiança e segurança
3 Poder financeiro -
4 Experiência de compras: esforço Facilidade de uso
5 Experiência de compras/ serviço ao cliente Esforço/ taxa de resposta e empatia
60
O modelo utilizado no estudo foi uma SOM bidimensional retangular com 15
x 12 células hexagonais. Na primeira etapa a SOM, que é um modelo não
supervisionado, foi utilizada em conjunto com um modelo supervisionado. A
utilização de um modelo não supervisionado foi justificada pela sua
contribuição, fazendo a tomada de decisão mais intuitiva através da explicação
do processo de classificação. O mapeamento das classes (branco para
compradores, preto para não compradores e tons de cinza para classes não
bem definidas) é mostrado na Figura 4.
Figura 4 Mapeamento das classes segundo a SOM (branco para
compradores, preto para não compradores e tons de cinza
para classes não bem definidas)
Como é possível reparar, o lado esquerdo e a parte de baixo correspondem
a classe dos não compradores, enquanto que a parte de cima, o lado direito e o
centro correspondem aos compradores. Como se tratam de dados reais, não
foi possível separá-los completamente.
Esta classificação obtida através do método não supervisionado pôde ser
melhorada de duas formas. A primeira foi comparando o mapa obtido com os
mapas que mostravam os pesos de cada variável em cada célula do mapa. A
segunda foi renomeando cada célula com o nome do atributo cujo peso fosse o
61
maior (em valor absoluto). Ambos os métodos ajudaram a determinar a
importância relativa de cada fator individualmente, mas não forneciam
explicação da correlação destes fatores com a propensão a fazer compras on-
line.
Na segunda etapa, uti lizando-se apenas o treinamento não supervisionado,
tentou-se agrupar os clusters obtidos em super-clusters. Para a criação dos
super-clusters foi uti lizado uma combinação de métodos onde as células com a
menor distância para os vizinhos seriam consideradas centróides, e as outra
unidades seriam agrupadas nos clusters. A escolha do número de centróides é
arbitrária. Entretanto utilizou-se um modelo que mede a qualidade da
segmentação em função do número de clusters. A base do deste cálculo é que
a segmentação deve maximizar tanto a homogeneidade interna dos grupos,
como a heterogeneidade entre grupos. O Gráfico 3 mostra o resultado obtido.
Em função deste resultado, decidiu-se trabalhar com 5 super-clusters. Estes
grupos são mostrados na Figura 5.
PONTUAÇÃO DE QUALIDADE
NÚMERO DE CLUSTERS
Gráfico 3 Qualidade versus número de clusters
62
Figura 5 Posicionamento dos 5 super-clusters no mapa da SOM
Para se chegar a uma conclusão sobre as características destes grupos,
complementou-se estas informações com as obtidas na utilização do SOM em
conjunto com métodos supervisionados:
a. Grupo 1 – Englobava a região dominada por uma baixa pontuação no
poder financeiro, sendo também influenciada por baixos valores no fator
controle do risco. Para este grupo, a principal barreira à realização de
compras on-line era a falta de dinheiro. Este grupo pôde ser rotulado
como os „conscientes do custo‟ (C.C.) e envolvia 12,2% dos padrões de
treinamento;
b. Grupo 2 – Englobava a região dominada por baixos valores de facilidade
de uso, sendo reforçado por baixos ou médios valores nos demais
quesitos. Eram as pessoas que sofrem de tecnofobia e são relutantes
contra as novas inovações. Este grupo pôde ser rotulado como os
„avessos à complexidade‟ (A.C.) e envolvia 11,4% dos padrões de
treinamento;
c. Grupo 3 – Englobava a região dominada por baixos valores de
compatibilidade, havendo um subgrupo, no meio, com altos valores no
fator controle do risco. Eram as pessoas que não acham a experiência de
compras on-line conveniente ou compatível suficiente com os seus
63
hábitos. Este grupo foi rotulado como os „não convictos‟ (N.C.) e envolvia
25% dos padrões de treinamento;
d. Grupo 4 – Englobava a região dominada por altos valores nos fatores
compatibilidade, controle do risco e poder financeiro. Era o oposto do
grupo 3, sendo composto por pessoas que achavam as compras on-line
conveniente e compatível e não tinham problemas com o risco ou a falta
de dinheiro. Este grupo foi ser rotulado como os „convictos‟ (C.) e
envolvia 36,7% dos padrões de treinamento;
e. Grupo 5 – Englobava a região dominada por baixos valores no fator
controle do risco, combinados com altos valores de compatibilidade. Na
parte de baixo do mapa predominavam altos valores de esforço. Este
grupo foi rotulado como os „cientes da segurança‟ (C.S.) e envolvia
14,6% dos padrões de treinamento.
II.3.4. Outros exemplos
Há diversos outros exemplos na literatura sobre aplicações do data mining
no mundo de negócios, e principalmente no CRM.
Um exemplo interessante, não relacionado ao CRM é mostrado por Hui e
Jha (2000). No seu artigo, os autores descrevem como é possível aplicar
técnicas de data mining que extraiam conhecimento de uma base de dados de
serviço ao cliente. Este conhecimento visa dois tipos de iniciativas: a tomada
de decisão no nível gerencial e o diagnóstico de falha nas máquinas.
Outro exemplo que merece ser citado é descrito por Sforna (2000). Uma
empresa energética italiana utilizou o data mining em sua base de clientes
corporativos para descobrir hábitos de consumos anômalos. Detectando os
clientes que possuíam perfis de consumo não condizentes com os seus tipos
de contratos, a empresa pôde propor-lhes novos contratos que se ajustassem
melhor às suas necessidades.
64
II.4. FIDELIZAÇÃO E O VAREJO
II.4.1. Relacionamento com clientes no varejo
Segundo Cross e Smith (1994), a união de forças sociais, econômicas e
tecnológicas está transformando a indústria do varejo nos E.U.A.. Entre as
mudanças que podem ser observadas os autores citam:
a. Mais de 50% dos consumidores não têm tempo para gastar com as suas
compras, e preferem os canais que lhes oferecem maior valor e
conveniência, reconhecendo a sua lealdade;
b. Os clientes estão ficando resistentes às mensagens e formatos
tradicionais de marketing;
c. A proliferação dos canais de vendas está aumentando o poder de
barganha dos clientes;
d. Os clientes estão respondendo às novas tecnologias, desde que estas
simplifiquem suas compras, tornando-as mais rápidas e convenientes;
e. Os clientes também estão respondendo aos programas de marketing
customizados, onde a comunicação se baseia no histórico de transações
e que recompensem a lealdade dos clientes.
Os autores afirmam que hoje em dia, muitos varejistas ainda constroem suas
bases de dados como meios de atingir seus clientes mais valiosos através de
propaganda e promoções. Deste modo esta base de dados de clientes não
está criando lealdade. Para ir um passo além, os varejistas precisam adotar
uma nova visão: os dados precisam ser considerados um ativo essencial para
o marketing, pois só assim é possível utilizar estes dados de forma mais
criativa:
a. Aumentando a penetração geográfica através de modelos que
determinam quais as localizações ótimas das lojas;
65
b. Aumentando a lealdade através do diálogo com o cliente, criando
comunicações personalizadas;
c. Criando sinergias entre os diversos canais de marketing, maximizando o
fluxo de comunicação e o tráfico de informação por estas mídias;
d. Determinando os momentos ideais para que os estoques sejam
abastecidos, baseado nos padrões de consumo dos clientes;
e. Recrutando parceiros de marketing que estejam interessados em atingir
sua base de clientes, e parceiros que possuem uma base de clientes que
interesse para a empresa;
f. Integrando totalmente a informação dos clientes através de dados
financeiros e operacionais.
Taher, Leight e French (1996) afirmam que os varejistas precisam expandir o
conceito de varejo para além da loja e do produto físico. Uma pesquisa da
McKinsey revela que 65% da satisfação dos clientes resultam de fatores
intangíveis e subjetivos que transcendem o produto em si. Para manter e
conquistar seus clientes, os varejistas precisarão estar constantemente
superando as expectativas, e a melhor maneira de surpreendê-los e conquistá-
los é agregando serviços aos produtos.
II.4.2. Oportunidades do comércio on-line
Conforme Albertin e Marques (1999) a informatização e a internet não
servem apenas para agilizar a operação das lojas. Elas são meios eficientes de
transformar os dados, que são armazenados ao longo de todo o processo de
comercialização, em informações que permitam a análise de resultados e a
definição de planejamentos estratégicos.
Segundo os autores, o comércio eletrônico ajuda na relação entre empresas
e clientes, pois facilita as empresas compreendê-los e realizar a venda pró-
ativa de novos produtos. O comércio eletrônico permite uma melhor
comunicação com os clientes, relações de vendas mais eficientes e um
aumento da atratividade dos mercados de consumo.
66
Os autores afirmam que pôde ser observado em dois casos estudados, que
a grande contribuição do uso da tecnologia foi a viabilização da customização
em massa. Este fato ficou claro pois, nos dois casos, os sites montados pelas
empresas varejistas elaboravam carrinhos de compras de acordo com as
necessidades de cada usuário. Em um dos casos, a empresa chegava a utilizar
os dados obtidos através das compras on-line na construção de um programa
de marketing direto, onde as malas diretas eram segmentadas de acordo com
o perfil de cada cliente.
II.4.3. Uma breve descrição do mercado varejista brasileiro
Uma pesquisa elaborada em conjunto pela Abras (Associação Brasileira de
Supermercados) e ACNielsen mostra o panorama do mercado de auto -serviço
brasileiro (SUPERHIPER, 2000). A pesquisa revela, conforme pode ser
observado na Tabela 3, que o auto-serviço brasileiro faturou em 1999 R$
60,123 bilhões, 2,7% menos que no ano anterior, mantendo sua participação
de 6% no PIB nacional. O lucro médio auferido deste setor também diminuiu
em relação a 1998, passando de 1,5% para 1,3%. Mesmo assim, houve um
aumento de 7,4% no número de lojas, chegando a mais de 55 mil pontos-de-
venda no Brasil em 1999, contra os 51,5 mil do ano anterior. Deste modo, o
setor apresentou, ainda que discreto, um aumento de postos de trabalhos
disponíveis, ultrapassando a marca dos 670 mil empregos diretos. O espaço
total da área de vendas no setor também cresceu, exibindo um aumento de
3,1% em relação a 1998, e alcançando a marca de 13,1 milhões de metros
quadrados em todo o Brasil.
67
Tabela 3 O auto serviço alimentar brasileiro
1994 1995 1996 1997 1998 1999
1998x1999 Variação %
Nº de lojas (total auto-
serviço) 37.543 41.839 43.763 47.787 51.502 55.313 7,4
Faturamento anual (em
bilhões de reais nominais) 34,9 40,6 46,8 50,4 55,5 60,1
+8,3
nominal
Faturamento anual – em
bilhões a preços de 1999* 58,4 56,3 58,4 58,3 61,8 60,1 -2,7 real
Participação % do
faturamento sobre o PIB* 6 7 6 6 6 6 -
Nº de empregos diretos 650.000 655.200 625.000 655.000 666.752 670.086 0,5
Área de vendas (em milhões
de m2)
n.d. n.d. n.d. 12,0 12,7 13,1 3,1
Nº check-outs n.d. n.d. n.d. 123.170 125.867 135.914 8,0
n.d.: Não disponível * A preços de 1999 – todos os valores foram trazidos para
31/12/1999
Fonte: Abras/ACNielsen (SUPERHIPER, 2000)
Tabela 4 Síntese do resultados - 1999
Faturamento nominal (R$ bilhões)
Nº de lojas
Nº de check-outs
Nº de funcionários
Área de vendas em m
2 (milhões)
Setor auto-serviço 60,1 55.313 135.914 670.086 13,1
Segmento supermercado
55,4 24.112 104.713 292.103 10,1
20 maiores * 30,0 1.548 25.201 177.674 3,0
300 maiores * 42,0 3.199 37.641 262.797 4,3
*Dados ajustados devido às movimentações do setor em 1999 (fusões, aquisições, fechamentos, falências, ausências e etc.).
Fonte: Abras/ACNielsen (SUPERHIPER, 2000)
O segmento de supermercados (composto pelas lojas que possuem dois ou
mais check-outs) cresceu no último ano a uma taxa ligeiramente superior à
média do auto-serviço: 10,6% contra 7,4%, totalizando 24,1 mil lojas, ou o
correspondente a 43,6% do total do setor de auto -serviço (ver Tabela 4 e
Gráfico 4). Este segmento também aumentou sua participação no faturamento
do auto-serviço em relação ao ano anterior, saindo de 91% em 1998 para
92,2% do faturamento total nominal (o equivalente a R$ 55,4 bilhões) em 1999.
68
Este aumento de participação vem se mantendo nos últimos cinco anos,
partindo de 87,5% em 1995 para mais de 92% em 1999 (ver Gráfico 5).
9091
9293
9495
9697
9899
23,3
33,432,7 34,0
37,541,0 43,8
47,851,5
55,3
14,2 14,715,9 16,6 17,0 19,9
20,7 21,2 21,8 24,1
0
10
20
30
40
50
60
Segmento supermercado (2 ou mais check-outs)
Total auto-serviço
Gráfico 4 Segmento supermercado x Total auto-serviço - número de
lojas (em mil)
O setor de supermercado tradicional (entre 251 e 2.500 metros quadrados)
responde por mais de 63% do total das 24.100 lojas com dois ou mais check-
outs. Já o formato hipermercado, que no final de 1999 registrava pouco menos
de 200 lojas e um índice de participação de 5,3% do número total de lojas no
país, se consolidou como um abastecedor, tendo seu foco dirigido às pessoas
que fazem suas compras de abastecimento uma ou duas vezes por mês.
As 20 maiores redes do setor, possuem um alto faturamento, entretanto a
média de área de vendas de cada uma das suas lojas diminuiu
significativamente. Ao longo de toda a década até 1998, havia um mo vimento
crescente de área de vendas média por loja – as 20 maiores saíram de uma
média de 1.539 metros quadrados por ponto-de-venda em 1990 para 2.585
metros quadrados por loja em 1998. Entretanto, de janeiro a dezembro do ano
de 1999, houve um decréscimo desse valor médio, baixando para 1.910 metros
quadrados por loja. Esse indicador de performance pode ser reflexo do forte
69
processo de aquisição de redes com lojas menores implantado pelas três
primeiras empresas do ranking.
Pela representatividade das 300 maiores empresas no setor, que somam
3.199 lojas, nota-se que estas apresentaram resultado muito próximo à média
do setor em 1999, ou seja, índice negativo de desempenho de 2,1%, contra o
de 2,7% do setor auto-serviço como um todo. Essa diferença de percentual
advém da influência do desempenho negativo do faturamento das 20 maiores,
que registraram queda de 2,9% no ano de 1999 em relação a 1998. Já as 280
restantes praticamente obtiveram resultados estáveis frentes ao ano anterior –
índice negativo de 0,1%. Um dos principais fatores que podem ter contribuído
para o baixo resultado das 20 principais empresas do setor é a acirrada
concorrência estabelecida entre elas.
87,5
12,5
87,4
12,6
90,6
9,4
91,0
9,0
92,2
7,8
0
20
40
60
80
100
95 96 97 98 99
Auto-serviço 1 check-out
Segmento supermercado (2 ou mais check-outs)
Gráfico 5 Evolução da participação de lojas supermercados no
faturamento total do setor de auto-serviços (em %)
A pesquisa confirma que, a exemplo de 1997 e de 1998, em 1999 houve um
aumento no nível de concentração do setor supermercadista brasileiro nas
mãos das principais redes. Os dados apontam para um índice de concentração
6% maior em 1999, em relação a 1998, que, por sua vez, também já fora 6%
70
superior ao de 1997. Com isso, as cinco maiores fecharam dezembro último
com 39% das vendas totais do setor.
II.4.4. Exemplos de aplicação do CRM no mercado varejista
brasileiro
Hirata (2000) mostra três exemplos de aplicações de iniciativas de CRM no
varejo brasileiro: a rede ABC Supermercados (Divinópolis, MG), o grupo Pão
de Açúcar e o supermercado d‟Avó (São Paulo).
II.4.4.1. Rede ABC Supermercados (Divinópolis, MG)
O ABC Supermercados, com seis lojas em Divinópolis (MG), contratou a
empresa Key Work Tecnologia e Marketing para a instalação de um software
canadense com a finalidade de armazenar, nos primeiros seis meses, dados de
50 mil clientes.
Estes dados seriam obtidos através do lançamento de um cartão de
fidelização. Para obter o cartão o cliente deveria preencher uma proposta de
adesão, que seria avaliada. Em caso de aprovação, ele receberia o cartão num
prazo de 15 dias. Para incentivar a adoção do cartão, a empresa lançaria a
campanha „Usou, ganhou‟, onde para cada R$ 1,00 em compras o cliente
acumularia dois pontos que, somados aos pontos extras acumulados em
determinados produtos, poderiam ser trocados por prêmios. Os pontos extras
nos produtos seriam definidos através de parcerias com os fornecedores.
Com este programa de fidelização, a empresa pretendia acumular
informações sobre quem compra nas lojas da rede e direcionar seus gastos
com marketing. A partir destes dados seria possível lançar campanhas
específicas, tendo como base o cruzamento das informações no banco de
dados da empresa. A expectativa era de registrar 280 mil cartões em oito
meses.
Com o novo sistema, a rede pretendia faturar R$ 63 milhões em 2000, frente
aos R$ 50 milhões registrados no ano anterior. Para o desenvolvimento do
71
programa de fidelização, o ABC Supermercados destinaria desde julho de
2000, durante 90 dias, 2% do seu faturamento.
II.4.4.2. Grupo Pão de Açúcar
O Grupo Pão de Açúcar lançou o „Pão de Açúcar Mais‟, um cartão de
fidelidade que permite identificar os hábitos de compra de cada um dos seus
clientes. A empresa investiu R$ 5 milhões no projeto, que incluiu a compra de
um software americano cuja capacidade de armazenamento é de cinco anos
de histórico para cada cliente. Este era um cartão de identificação e não de
pagamento, pois ele não estava atrelado à oferta de brindes.
A utilização do cartão Mais funcionaria nos mesmos moldes que os demais
cartões de fidelização existentes no mercado. O cliente apresentaria o cartão
no caixa toda vez que realizasse suas compras, o leitor óptico faria a
decodificação e o software coletaria as informações qualitativas e quantitativas,
tais como dados de compra, tipo de produto, freqüência na loja e valor da
compra. Essas informações seriam cadastradas em um computador centra l e a
partir delas a empresa lançaria perguntas sobre um determinado perfil de
cliente. Com as respostas fornecidas pelo software, o departamento de
marketing desenvolveria promoções de iniciativa da própria empresa ou com o
apoio dos fornecedores. Havia uma estimativa de que uma campanha de
marketing pode influenciar o cliente de 15 a 25 vezes por ano, no mínimo.
Em um mês e meio de funcionamento do sistema, foram cadastradas 210
mil famílias. Esse número foi suficiente para iniciar as ações de marketing
dirigidas. Em quatro meses os primeiro resultados já puderam ser percebidos
nas famílias registradas:
a. O aumento do tíquete médio de compras foi de 19%;
b. O aumento na freqüência desses consumidores às lojas foi de 42%.
Neste período, a empresa lançou 38 campanhas de marca própria e outras
em conjunto com os fornecedores, havendo casos de fornecedores que tiveram
aumento de 50% nas vendas. Uma das campanhas que a empresa lançou foi o
72
„Dia a Dia Mais‟. A cada R$ 50 de compras e mais R$ 9,90, o cliente ganhava
um kit de panelas especialmente desenhadas para o Pão de Açúcar.
II.4.4.3. Supermercado d’Avó (São Paulo)
A cadeia de supermercado D‟Avó, com seis lojas em São Paulo, lançou o
Cartão Confiança em 1997. Trata-se de um cartão de crédito direcionado para
o consumidor de baixa renda, que não tinha acesso ao sistema bancário e que,
por essa razão, não possuía talão de cheque. O objetivo do cartão era: resolver
a questão de crédito e ao mesmo tempo fidelizar o cliente. O D‟Avó tem o
registro de todos os portadores do Cartão Confiança desde 1997. Neste
período, a empresa já registrou 145 mil pessoas, que podem a qualquer
momento serem surpreendidas com uma promoção ou apenas um gesto
singelo das lojas da rede D‟Avó.
Um exemplo de campanha de marketing que só foi possível através do
cartão foi a distribuição de cestas de café da manhã para um seleto grupo de
clientes. Para traçar o perfil dos consumidores que receberiam as cestas, o
D‟Avó buscou em seu banco de dados senhoras que tinham o Cartão
Confiança, eram casadas, com filhos, que mantinham suas contas do cartão
em dia e que freqüentavam a loja todos os sábados. O cruzamento desses
dados foi realizado e chegou-se a 180 pessoas com esse perfi l que foram
contempladas com as cestas de café da manhã. No ano anterior, 150 clientes
haviam sido contemplados com a mesma campanha.
Outra campanha foi a de reavaliação de crédito. Nesse caso, os dados
encaminhados para o sistema eram de consumidores que gastavam todo o
crédito do cartão e pagavam 100% da fatura. Foram selecionados 1.643
clientes com esse perfil.
73
CAPÍTULO III METODOLOGIA
III.1. TIPO DE PESQUISA
Após fazer uma breve revisão da literatura sobre CRM e apresentar algumas
técnicas de extração de conhecimento em banco de dados, este trabalho, a
partir deste ponto, vai exemplificar a utilização de algumas destas técnicas
destacando as informações que podem ser obtidas.
Para classificar este estudo, foi adotada a proposta apresentada por Vergara
(1997), segundo a qual uma pesquisa pode ser classificada quanto aos seus
fins e quanto aos seus meios.
Quanto aos fins, esta pesquisa é uma pesquisa aplicada. Ela é motivada por
um problema real enfrentado por empresas de varejo brasileiras, e para
resolvê-lo foram utilizados dados reais.
Quanto aos meios, esta será uma pesquisa de laboratório, telematizada e
bibliográfica.
Para desenvolver o referencial teórico foi feita uma introdução sobre CRM,
sendo necessário pesquisar publicações que falem sobre este tema. Para isto
foi necessário pesquisar materiais publicados em revistas, livros, jornais e que
sejam acessíveis ao público de uma maneira geral. Por estes motivos pode-se
caracterizar este estudo como bibliográfico.
Por ser um tema novo e que está diretamente envolvido com novas
tecnologias, principalmente o computador, muito material ainda não foi
publicado mas está disponível nos meios de comunicação. A internet é uma
fonte rica de conhecimento sobre a extração de conhecimento em bancos de
dados. Nela é possível encontrar artigos, opiniões e fóruns de debates que
falam exclusivamente sobre o CRM. Deste modo foi necessário pesquisar
neste meio, caracterizando a pesquisa como telematizada.
74
Para finalizar, este trabalho também pode ser classificado como uma
pesquisa de campo pois, apesar de uma grande parte do esforço ter sido gasto
com a utilização de computadores na aplicação de modelos que ajudem a
descrever o comportamento dos clientes, os dados utilizados eram reais. Eles
foram obtidos na base de dados de uma empresa de varejo.
III.2. UNIVERSO E AMOSTRA
Os dados utilizados nesta pesquisa foram obtidos junto a uma empresa
varejista brasileira. Esta empresa é uma das maiores do país pois, apesar de
não estar presente em todas as regiões, ela tem uma grande importância na
região onde está concentrada. Ela possui diversas cadeias de lojas, mas o
trabalho foi feito somente na cadeia de hipermercados. Foram analisados os
dados de quatro lojas, todas na mesma região metropolitana, porém
localizadas em bairros diferentes. O perfil demográfico destes bairros é bem
diferente. Devido a questões de sigilo, nem o nome da empresa, nem a
localização das lojas será divulgada.
O banco de dados utilizado continha as seguintes informações sobre as
compras realizadas no ano 2000: o número de identificação do cliente, o valor
da compra, a data da sua realização e a loja onde ela foi fei ta. Este banco de
dados não continha informação sobre todas as compras realizadas nas lojas,
havia somente dados das compras realizadas pelos clientes que possuíam um
cartão de fidelização. Este cartão não era exclusivo da rede de hipermercados,
nem da empresa. Por isto, estes clientes não eram, necessariamente, os mais
fiéis, leais ou lucrativos. Na verdade, pode haver pessoas que possuem este
cartão e nunca fizeram compras neste hipermercado. Este cartão pode ser
obtido facilmente através do pagamento de uma taxa. Ele distribui brindes à
medida que os clientes acumulam pontos nas diversas empresas que
participam deste projeto. Ele não é individual, possibilitando que uma família
inteira uti lize somente um cartão.
75
Os dados utilizados correspondem a todas as compras realizadas com o
cartão de fidelidade, em qualquer uma das 4 lojas estudadas da rede de varejo,
durante o ano 2000.
Seguindo a classificação sugerida por Vergara (1997), a amostra dos dados
foi obtida por acessibilidade já que o motivo da escolha da empresa utilizada foi
a facilidade de acesso aos dados.
III.3. COLETA DE DADOS
Os dados foram coletados diretamente do banco de dados da empresa. Por
isto, este estudo só pôde analisar as variáveis que estavam contidas neste
banco de dados. Não foi feita nenhum tipo de entrevista ou questionário com os
clientes para saber se os dados realmente refletem a realidade. Também não
se procurou saber o envolvimento dos clientes no programa de fidelização.
Este estudo se limitou exclusivamente a analisar os dados obtidos no banco de
dados e a descobrir informações escondidas que auxiliem na construção do
relacionamento entre a empresa e os clientes.
III.4. TRATAMENTO DOS DADOS
Como já foi dito, originalmente o banco de dados continha as seguintes
informações por compra: o número de identificação do cliente, o seu valor, a
data da sua realização e a loja onde ela foi feita.
Deste modo como estava organizado o banco de dados, se um cliente após
ter feito o pagamento se lembrasse que esqueceu um item e resolvesse
adquiri-lo neste mesmo instante, eram computadas duas compras separadas
para este cliente. Mesmo tendo sido realizadas num mesmo dia, por um
mesmo cliente e na mesma loja, estas compras não eram agrupadas. Por este
motivo, decidiu-se que todas as compras realizadas por um mesmo cliente, em
um mesmo dia, na mesma loja deveriam ser tratadas como uma compra só.
Mesmo sabendo-se que pode ter havido casos em que um mesmo cliente
76
tenha feito duas compras independentes (por exemplo, uma de manhã e outra
à tarde), preferiu-se trabalhar como se fosse uma compra só.
A primeira análise foi feita em cima das compras. Com os dados disponíveis
foi possível construir novas variáveis que informavam: o dia do mês da
realização da compra, o dia da semana e quanto tempo já havia se passado
desde que aquele mesmo cliente tivesse feito a compra anterior. De posse de
todas estas variáveis, primeiramente foram analisadas todas as compras. Em
seguida foi estudado como elas evoluíram ao longo do ano. O próximo passo
foi a descoberta de padrões sazonais ao longo do ano 2000. Por último foram
comparadas as características de cada loja.
O segundo grande grupo de análises foi feito em cima dos clientes. Em vez
de utilizar o banco de dados em que cada entrada era uma compra, as
informações foram agrupadas por cliente. Para cada cliente foi possível obter
as seguintes informações: valor médio das suas compras, valor total gasto,
número de compras que realizou, a loja onde realizou a maioria de suas
compras, o período do mês e o número de dias da semana onde concentrou
suas compras. Depois de construir este novo banco de dados, decidiu-se
trabalhar somente com os clientes que tivessem feito mais de doze compras ao
longo do ano (média de uma por mês). Selecionou-se estes clientes pois só
eles poderiam ter características de fidelidade e lealdade que seriam
interessantes para a empresa. O primeiro estudo em cima deste novo banco de
dados se limitou a descrever as principais características deste grupo de
clientes selecionados. Por último, tentou-se descobrir e verificar se era possível
criar alguma segmentação, baseada no padrão de compras, que indicasse
quem eram os clientes principais da rede. Utilizaram-se os seguintes critérios: o
período do mês, a quantidade de dias da semana e a loja que preferem fazer
suas compras.
Para fazer todas estas análises uti lizou-se principalmente o pacote
estatístico SPSS.
77
III.5. LIMITAÇÕES DO MÉTODO
Os modelos que foram utilizados podem até ser aplicados em outras
empresas de varejo, dependendo do grau de semelhança entre o
comportamento dos clientes e de como estiver montada a base de dados, mas
não necessariamente podem ser generalizados para todas as empresas que
possuem programas para gerenciar os dados de seus clientes. Alguns dos
padrões de compras encontrados podem até ser considerados como
comportamento característico dos clientes das redes de varejo em geral,
entretanto, os valores exatos obtidos serão diferentes quando este mesmo
estudo for aplicado a outras firmas. Empresas varejistas que atuem em outras
regiões ou outros segmentos de mercado podem encontrar resultados e
padrões de comportamento diferentes. De qualquer forma, quando estes
modelos forem aplicados em outras bases de dados, será necessário o
acompanhamento de especialistas no setor para confirmarem a relevância e a
coerência das informações obtidas.
78
CAPÍTULO IV ANÁLISES DESCRITIVAS
Primeiramente foi feita a análise das compras isoladamente, sem tentar
identificar os clientes. Cada compra era uma entrada no banco de dados. Para
cada compra se tinha as seguintes informações: data (dia, mês e dia da
semana), valor, a loja onde foi realizada e o número de identificação do cliente.
Foram estudadas as estatísticas descritivas de todas as compras ao mesmo
tempo. Em seguida analisou-se a evolução das compras ao longo do tempo
para tentar detectar a existência de padrões sazonais. Descobertos estes
padrões, o próximo passo foi examiná-los. Por último, estudou-se a diferença
entre as lojas.
Com as informações obtidas através das análises das compras, partiu-se
para a análise dos clientes. Neste caso, cada cliente era uma entrada no banco
de dados. Para cada cliente foi possível obter as informações já citadas sobre
todas as compras que realizou. O objetivo deste estudo foi a detecção de
possíveis características que possam auxiliar na segmentação e na descoberta
de quem são os clientes mais valiosos para a empresa. Tentou-se dividir os
clientes conforme o seu comportamento de compra ao longo do mês, ao longo
da semana e conforme a loja de sua preferência.
O roteiro de todas estas análises está mostrado na Tabela 5.
Tabela 5 Mapa das análises.
IV.1 Análise das compras............................................................................................... 79
IV.1.1 Análise geral de todas as compras ...................................................................... 79
IV.1.2 Análise da evolução das compras ao longo do tempo .......................................... 84
IV.1.3 Análise dos padrões sazonais de compras .......................................................... 89
IV.1.4 Análise por loja ................................................................................................ 111
IV.2 Análise dos clientes .............................................................................................. 117
IV.2.1 Análise geral de todos os clientes ..................................................................... 117
IV.2.2 Segmentação por período do mês .................................................................... 123
IV.2.3 Segmentação por número de dias da semana ................................................... 127
IV.2.4 Segmentação por loja ...................................................................................... 130
79
IV.1. ANÁLISE DAS COMPRAS
Através da análise das compras, a empresa pode dimensionar melhor a
quantidade de funcionários em função da quantidade de compras esperada
para um determinado dia, mantendo o nível de qualidade, mesmo quando o
número de clientes na loja é elevado. Com esta análise, também é possível
descobrir quais os dias em que o volume de vendas é baixo e tentar criar
campanhas de marketing que estimulem os consumidores a comprarem nestes
dias. Esta análise ainda não permite um contato direto com os clientes, nem a
identificação dos mais valiosos, entretanto através da descoberta de padrões
existentes nas compras é possível estendê-los e utilizá-los como base para a
segmentação dos clientes.
IV.1.1. Análise geral de todas as compras
Para servir de base comparativa para as outras análises, o primeiro estudo
incluiu todas as compras, não havendo nenhuma separação quanto ao período
ou à loja onde a compra foi feita
IV.1.1.1. Análise do valor das compras
A primeira variável que foi estudada foi o valor de cada compra realizada.
Conforme pode ser visto na Tabela 6, a base de dados contém 1.209.201
compras. O valor mínimo foi de R$5,00, sendo este valor determinado pela
empresa como o mínimo para a utilização do cartão de fidelização. Para
transações com valores menores que este, não é permitida a utilização do
cartão de fidelização. A maior compra foi de R$21.139,00, que é um valor muito
alto levando-se em consideração que ela foi feita em uma loja de varejo.
Provavelmente, esta compra continha aparelhos eletro-eletrônicos, que são os
itens de maior valor agregados nas lojas. O valor médio das compras foi de
R$110,36, a moda foi R$19,50 e a receita total das compras foi
R$133.450.190,00.
80
Tabela 6 Estatísticas descritivas e percentis do Valor das compras.
Estatística Erro padrão Percentis (%) Valor
Número de casos 1.209.201 5 10,50
Mínimo 5,00 10 15,50
Máximo 21.139 25 30,50
Soma 133.450.190 50 67,50
Média 110,36 75 140,00
Moda 19,50 90 244,00
Desvio Padrão 153,67 95 334,50
Assimetria 14,11 ,0022
Curtose 871,19 ,0045
Observando o coeficiente de assimetria, de curtose e os percentis mostrados
na Tabela 6 é possível observar que a distribuição do valor das compras é
muito assimétrica positivamente. O histograma e o P-P Plot exibidos no Gráfico
6 confirmam esta suspeita (em função da quantidade de dados, não foi
possível fazer estes gráficos com todos os dados, foram utilizados somente 1%
das compras, sorteadas aleatoriamente). É interessante notar que devido à
limitação do valor mínimo para a utilização de cartão, a distribuição não pode
ser considerada uma exponencial. A Tabela 7 mostra o resultado do teste
Kolmogorov-Smirnov que rejeita a hipótese da distribuição do valor das
compras ser exponencial. É interessante notar que devido ao volume de dados,
este teste estatístico perde seu valor pois os intervalos de confiança passam a
ser muito baixos e qualquer perturbação já causa a rejeição da hipótese de
igualdade das distribuições. Por este motivo, nas próximas comparações entre
distribuições só se mostrará os resultados do teste Kolmogorov-Smirnov se ele
indicar similaridade.
81
Valor das compras
48
0 -
50
0
44
0 -
46
0
40
0 -
42
0
36
0 -
38
0
32
0 -
34
0
28
0 -
30
0
24
0 -
26
0
20
0 -
22
0
16
0 -
18
0
12
0 -
14
0
80
- 1
00
40
- 6
0
0 -
20
Histograma
Valor das compras
Núm
ero
de
casos
3.000
2.500
2.000
1.500
1.000
500
0
P-P Plot exponencial
Valor das compras
Probabilidade cumulativa observada
1,00,75,50,250,00
Pro
bab
ilida
de
cu
mula
tiv
a e
spe
rad
a
1,00
,75
,50
,25
0,00
Gráfico 6 Histograma e P-P Plot do Valor das compras.
Tabela 7 Teste Kolmogorov-Smirnov.
Valor das compras
N 11.888
Parâmetro da exponencial a,b
Média 109,28
Diferenças mais extremas Absoluta ,0495
Positiva ,0495
Negativa -,0481
Kolmogorov-Smirnov Z 5,40
Significância (bi -caudal) ,0000
a Distribuição teste é exponencial.
b Calculado dos dados.
IV.1.1.2. Análise do número de dias entre compras de um mesmo
cliente
Para começar a detectar padrões de compras entre os clientes, foi estudado
o número de dias entre compras realizadas por um mesmo cliente. Para cada
compra, foi calculado o intervalo de tempo entre esta compra e a anterior
realizada pelo mesmo cliente. O objetivo de estudar esta variável foi investigar
se há alguma correlação entre o intervalo de tempo e o valor de uma compra.
Intuitivamente, era esperado que, para clientes fiéis, quanto maior o intervalo
de tempo desde a última compra, maior o valor da compra.
82
A Tabela 8 mostra as estatísticas descritivas do número de dias entre
compras realizadas por um mesmo cliente. O número de casos estudados
(1.112.512 casos) foi menor que o número de compras total pois não foi
possível calcular o intervalo de tempo para a primeira compra de cada cliente.
Mesmo considerando que todas as compras realizadas por um mesmo cliente
em uma mesma loja num mesmo dia eram uma compra só, houve casos onde
clientes realizaram compras em lojas diferentes num mesmo dia. Por isso, o
intervalo mínimo entre compras foi zero. O intervalo máximo foi de 359 dias, ou
seja, esta pessoa ficou praticamente um ano sem voltar a uma loja da rede. O
intervalo médio de compras foi de 16,48 dias, que equivale a pouco mais que
duas semanas. Entretanto este valor médio é muito influenciado por valores
extremos e não é a moda e nem a mediana da distribuição. A moda foi o
intervalo de 7 dias. Pela análise dos percentis, é possível verificar que 50% das
compras foram feitas com um intervalo de tempo de até uma semana.
Tabela 8 Estatísticas descritivas e percentis do Número de dias entre
compras.
Estatística Erro padrão Percentis (%) Valor
Número de casos 1.112.512 5 1
Mínimo 0 10 2
Máximo 359 25 4
Média 16,48 50 7
Moda 7 75 17
Desvio Padrão 26,64 90 37
Assimetria 4,43 ,0023 95 62
Curtose 26,81 ,0046
Como pode ser observado na Tabela 8 e no Gráfico 78 a distribuição é
assimétrica positivamente. Como as compras realizadas na mesma loja em um
8 No eixo do “Número de dias entre compras”, o intervalo das barras inclui o valor inferior,
mas não compreende o valor superior escrito no eixo. Por exemplo, na primeira barra, onde
está escrito o intervalo “0-1” no eixo, somente o período de zero dia de intervalo entre compras
está incluso. A barra seguinte, cujo valor do intervalo não está escrito, compreende as compras
83
mesmo dia por um mesmo cliente foram agrupadas, o número de casos que o
intervalo entre compras é igual a zero é muito pequeno. No histograma, é
possível observar que a distribuição não pode ser considerada uma
exponencial, principalmente devido ao grande número de casos em que o
intervalo entre compras é um múltiplo de sete dias, ou seja múltiplos de uma
semana. Esta é uma constatação interessante, pois revela que os clientes
tendem a ter um dia fixo na semana em que realizam suas compras. Este
padrão de repetição de compras semanal é muito maior que o padrão de
compras mensal. No histograma não é nem possível observar uma
concentração do intervalo entre compras próximo a 30 dias.
Número de dias entre compras
38
- 3
9
36
- 3
7
34
- 3
5
32
- 3
3
30
- 3
1
28
- 2
9
26
- 2
7
24
- 2
5
22
- 2
3
20
- 2
1
18
- 1
9
16
- 1
7
14
- 1
5
12
- 1
3
10
- 1
18 -
9
6 -
7
4 -
5
2 -
3
0 -
1
Histograma
Número de dias entre compras
Núm
ero
de
casos
1.200
1.000
800
600
400
200
0
P-P Plot exponencial
Número de dias entre compras
Probabilidade cumulativa observada
1,00,75,50,250,00
Pro
bab
ilida
de
cu
mula
tiva
es
pe
rada
1,00
,75
,50
,25
0,00
Gráfico 7 Histograma e P-P Plot do Número de dias entre compras.
IV.1.1.3. Análise da relação entre o valor das compras e o número de
dias entre compras de um mesmo cliente
Numa tentativa de detectar uma relação entre o valor das compras e o
intervalo de tempo entre a última compra do cliente, foi feita uma regressão em
que a variável independente era o intervalo de tempo e a variável dependente
era o valor da compra. O coeficiente beta, que mede a significância desta
regressão, foi muito baixo (0,09), indicando que não há correlação entre as
variáveis. Para visualizar melhor esta falta de correlação, uti lizou-se 0,01% dos
com um dia de intervalo. Esta mesma convenção vale para todos os histogramas cujos eixos
das abscissas estejam representados por intervalos.
84
dados para construir um gráfico de dispersão entre o intervalo de tempo e o
valor das compras (Gráfico 8). Visualizando este gráfico, não é possível
confirmar a existência de qualquer relação entre os dados, principalmente em
função da enorme quantidade de dados que podem ser considerados outliers.
Valor das compras x
Número de dias entre compras
Número de dias entre compras
50403020100
Valo
r d
as
com
pra
s
1.000
800
600
400
200
0
Gráfico 8 Gráfico de dispersão entre o Número de dias entre compras e
o Valor das compras.
IV.1.2. Análise da evolução das compras ao longo do tempo
Após a análise de todas as compras, o próximo passo foi estudar a sua
evolução ao longo do ano. Saber como se comporta o volume de compras ao
longo dos meses e dos dias do ano é o primeiro passo para se conseguir fazer
previsões de vendas para períodos específicos. O estudo da evolução das
compras ao longo do tempo também possibilita a descoberta de padrões de
sazonalidades, que ajudam a entender o comportamento dos clientes.
IV.1.2.1. Análise das compras ao longo dos meses do ano
Nesta análise, as compras foram agrupadas conforme os meses em que
foram realizadas. A Tabela 9 mostra as estatísticas descritivas do valor das
compras agrupadas conforme os meses do ano e é possível verificar que há
significativas variações de comportamento com o decorrer dos meses. O mês
com maior número de compras é agosto (116.588 compras), superando
inclusive o mês de dezembro quando o Natal normalmente causa um aumento
85
nas vendas (a comparação entre o número de compras por mês também pode
ser vista no Gráfico 9). Entretanto, dezembro é o mês com maior valor médio
(R$123,44) e maior valor total de compras (R$13.729.916,00) – estes
resultados também podem ser vistos no Gráfico 9.
Em função destes resultados, a empresa deve tentar entender qual foi o
motivo da maior quantidade de vendas em agosto. A causa pode ter sido
fatores econômicos externos, já que o consumo depende das condições
financeiras da população, ou a realização de promoções que estimularam o
consumo neste mês. No caso deste aumento de vendas em agosto ter sido
causado por promoções, cabe à empresa analisar se o resultado final foi
lucrativo ou não.
Tabela 9 Estatísticas descritivas do Valor das compras para os
diferentes meses do ano.
Número de casos
Mínimo Máximo Soma Média Desvio Padrão
Assimetria Curtose
Janeiro 91.465 5,00 6.296 10.315.630 112,78 146,91 7,59 142,65
Fevereiro 91.913 5,00 9.528 10.006.010 108,86 133,35 9,57 386,94
Março 93.796 5,00 16.047 10.437.050 111,27 151,44 23,87 1.816,27
Abril 94.064 5,00 4.060 10.489.020 111,51 134,81 5,68 75,67
Maio 101.288 5,00 8.588 11.534.513 113,88 164,91 9,56 215,31
Junho 104.959 5,00 10.878 11.605.691 110,57 161,80 12,23 420,32
Julho 109.543 5,00 6.101 11.688.460 106,70 143,39 7,95 163,61
Agosto 116.588 5,00 8.550 12.625.400 108,29 155,67 9,50 227,52
Setembro 103.878 5,00 7.116 11.097.365 106,83 149,70 7,66 136,85
Outubro 99.374 5,00 6.307 10.462.016 105,28 137,85 7,62 161,57
Novembro 91.109 5,00 21.139 9.459.114 103,82 179,60 40,90 3.845,64
Dezembro 111.224 5,00 11.667 13.729.916 123,44 172,82 9,99 317,93
Observando a análise dos percentis para o valor das compras (Tabela 10), é
possível perceber que até o percenti l 10% os meses apresentam
comportamento muito semelhantes. Para percentis maiores, o mês de
dezembro passa a se diferenciar apresentando os maiores valores de compras.
Comparando os percentis com o desvio padrão e a assimetria, pode-se
reparar que valores extremos têm uma importância muito grande no cálculo
86
destas estatísticas. O mês de novembro só apresenta o maior desvio padrão e
a maior assimetria devido ao fato da maior compra do ano ter sido realizada
neste mês, já que pela análise dos percentis os seus resultados não são
diferentes dos outros meses.
Mês do ano x Número de Compras
Mês do ano da realização da compra
Dezembro
Novembro
Outubro
Setembro
Agosto
Julho
Junho
Maio
Abril
Março
Feverei ro
Janeiro
Núm
ero
de
co
mpra
s
120.000
110.000
100.000
90.000
80.000
70.000
60.000
50.000
40.000
30.000
20.000
10.000
0
Mês do ano x Valor Médio da Compra
Mês do ano da realização da compra
Dezembro
Novembro
Outubro
Setembro
Agosto
Julho
Junho
Maio
Abril
Março
Feverei ro
Janeiro
Valo
r m
édio
das
com
pra
s
130
120
110
100
90
80
70
60
50
40
30
20
10
0
Mês do ano x Valor Total das Compras
Mês do ano da realização da compra
Dezembro
Novembro
Outubro
Setembro
Agosto
Julho
Junho
Maio
Abril
Março
Feverei ro
Janeiro
Valo
r to
tal
da
s c
om
pra
s
14.000.000
13.000.000
12.000.000
11.000.000
10.000.000
9.000.000
8.000.000
7.000.000
6.000.000
5.000.000
4.000.000
3.000.000
2.000.000
1.000.000
0
Gráfico 9 Gráfico de barras do número total, média e valor total de
compras em relação ao mês do ano.
A comparação entre médias através do método ANOVA rejeitou a hipótese
de igualdade do valor médio das compras entre os meses do ano. O valor da
estatística F foi de 119,32, que para uma distribuição com 1.209.200 graus de
liberdade no total corresponde a um nível de significância igual a 0,0000, e o
valor do coeficiente R2 foi de 0,001. Esta rejeição já era esperada através da
análise visual do Gráfico 9. Entretanto, o método ANOVA apresenta a mesma
limitação que o teste Kolmogorov-Smirnov, pois devido ao grande número de
dados, o intervalo de confiança para as médias fica muito pequeno, e qualquer
perturbação é suficiente para levar à rejeição da hipótese de igualdade.
87
Tabela 10 Percentis do Valor das compras para os diferentes meses do
ano.
Percentis (%)
5 10 25 50 75 90 95
Janeiro 11,50 16,50 33,00 71,50 143,00 245,00 335,50
Fevereiro 11,00 16,00 32,00 69,50 141,50 242,50 328,00
Março 11,50 16,50 33,00 72,00 145,00 246,00 330,50
Abril 11,50 17,00 33,00 71,50 144,50 247,00 331,50
Maio 11,00 16,00 31,50 69,00 142,50 248,00 339,50
Junho 10,50 15,00 29,50 66,00 140,00 244,50 337,00
Julho 10,50 15,00 29,00 64,50 135,50 237,50 325,00
Agosto 10,00 14,50 29,00 64,50 135,50 239,50 329,50
Setembro 10,00 14,50 28,50 64,00 133,50 236,50 325,50
Outubro 10,00 14,50 29,00 64,00 135,50 235,50 323,50
Novembro 10,00 14,50 27,50 61,00 129,00 232,00 321,50
Dezembro 11,50 16,50 34,00 75,00 153,50 272,50 381,00
Não foi possível fazer a comparação entre o número de dias entre compras
de um mesmo cliente ao longo dos meses do ano pois só há dados a partir de
janeiro de 2000. Deste modo, no mês de janeiro a maioria das compras foi
calculada como se fosse a primeira do cliente, e não há como saber quando foi
a última vez que ele havia feito compra em 1999.
IV.1.2.2. Análise das compras ao longo dos dias do ano
Pode-se entender melhor as variações das compras ao longo dos meses do
ano, através dos gráficos com o número, o valor médio e o valor total das
compras ao longo dos dias do ano (Gráfico 10). É possível observar no gráfico
que o período onde as vendas foram mais fracas foi no início de março e no
final de abril (as linhas pretas nos gráficos dividem os meses do ano). Nestas
datas ocorreram o carnaval e a semana santa respectivamente. Também é
possível notar o aumento das vendas em agosto, principalmente na primeira
quinzena.
88
Dia do ano x Número de Compras
Dia do ano da realização da compra
364,00
343,00
323,00
303,00
282,00
262,00
242,00
222,00
202,00
182,00
162,00
142,00
122,00
102,00
82,00
62,00
42,00
22,00
2,00
Núm
ero
de
co
mpra
s
6.000
5.000
4.000
3.000
2.000
1.000
0
Dia do ano x Valor Médio da Compra
Dia do ano da realização da compra
364,00
343,00
323,00
303,00
282,00
262,00
242,00
222,00
202,00
182,00
162,00
142,00
122,00
102,00
82,00
62,00
42,00
22,00
2,00
Valo
r m
édio
da c
om
pra
180
160
140
120
100
80
60
40
20
0
Dia do ano x Valor Total das Compras
Dia do ano da realização da compra
364,00
343,00
323,00
303,00
282,00
262,00
242,00
222,00
202,00
182,00
162,00
142,00
122,00
102,00
82,00
62,00
42,00
22,00
2,00
Valo
r to
tal
da
s c
om
pra
s
800.000
700.000
600.000
500.000
400.000
300.000
200.000
100.000
0
Gráfico 10 Número total, média e valor total de compras ao longo dos
dias do ano.
Analisando bem os gráficos é possível perceber que há um padrão sazonal
de alta freqüência, com a repetição dentro de um mês de vários dias com
valores abaixo da média. As funções de auto-correlação parcial para o número
total, a média e o valor total das compras (Gráfico 11) confirmam a existência
deste padrão sazonal. Nestes gráficos as linhas representam as semanas, e é
possível perceber que o padrão sazonal semanal é muito forte. A auto-
correlação para diferenças múltiplas de uma semana é bastante positiva,
revelando que há um padrão de compras que se repete. Observando com
muita atenção, principalmente o gráfico com o valor médio das compras,
também é possível observar que há uma sazonalidade mensal. Este padrão é
mais fraco, entretanto é possível ver que para diferenças de dias entre 10 e 20
dias a correlação é negativa e para diferenças entre 28 e 37 dias a correlação é
positiva.
89
Número de compras
realizadas no dia do ano
Intervalo de tempo (lag)
64
57
50
43
36
29
22
1581
Fun
çã
o d
e a
uto
-co
rre
laçã
o
1,0
,5
0,0
-,5
-1,0
Valor médio das compras
realizadas no dia do ano
Intervalo de tempo (lag)
64
57
50
43
36
29
22
1581
Fun
çã
o d
e a
uto
-co
rre
laçã
o
1,0
,5
0,0
-,5
-1,0
Valor total das compras
realizadas no dia do ano
Intervalo de tempo (lag)
64
57
50
43
36
29
22
1581
Fun
çã
o d
e a
uto
-co
rre
laçã
o
1,0
,5
0,0
-,5
-1,0
Gráfico 11 Função de auto-correlação do número total, média e valor
total de compras ao longo dos dias do ano.
IV.1.3. Análise dos padrões sazonais de compras
A existência de padrões de compras semanais e mensais indica um
comportamento dos clientes que deverá ser lembrado quando for feita a sua
segmentação. Para entender melhor estes padrões sazonais, o próximo passo
foi estudá-los mais a fundo.
IV.1.3.1. Análise da sazonalidade mensal
A existência de padrões de sazonalidade mensal é causada pelo fato da
maioria das pessoas receber o salário mensalmente. Antes de comentar os
resultados obtidos, é importante saber que a rede de varejo não funcionou nos
dias: 1º de janeiro (ano novo), 16 de outubro (dia do comércio) e 25 de
dezembro (natal). Os resultados também foram muito influenciados pelo fato de
90
fevereiro não possuir 30 dias, pela ocorrência de feriados e pela localização
destes dias dentro da semana.
O Gráfico 12 mostra o número de compras, o valor médio das compras e o
valor total das compras ao longo dos dias dos meses. Os gráficos com o
número de compras e o valor total das compras são os mais influenciados
pelos problemas com datas e feriados. Por exemplo, o menor número de
compras observado no dia 16 pode ser explicado devido à ocorrência do
feriado do dia do comércio.
Estudando o valor médio das compras ao longo dos dias do mês, é possível
observar que ela possui um pico no início do mês e que seus valores diminuem
na metade do mês. Este resultado pode ser uma conseqüência do fato de que
no início do mês, quando as pessoas recebem seus salários, elas tendem a
fazerem compras maiores para abastecerem suas casas. No meio do mês, as
compras passam a conter somente itens que tenham se acabado e produtos
perecíveis.
Para tentar verificar a hipótese de que os clientes comparecem mais às lojas
no início do mês, construiu-se o gráfico do número de dias desde a última
compra em função do dia do mês (Gráfico 13). Era de se esperar que no início
do mês o número de dias desde a última compra fosse maior, entretanto este
fato não foi comprovado. Pelo que é possível concluir, a quantidade de
compras permanece constante ao longo do mês, e por isso o intervalo de
compras não apresenta nenhum padrão que se destaque.
Dia do Mês x Número de Compras
Dia do mês da realização da compra
31,00
29,00
27,00
25,00
23,00
21,00
19,00
17,00
15,00
13,00
11,00
9,00
7,00
5,00
3,00
1,00
Núm
ero
de
co
mpra
s
50.000
40.000
30.000
20.000
10.000
0
Dia do Mês x Valor Médio da Compra
Dia do mês da realização da compra
31,00
29,00
27,00
25,00
23,00
21,00
19,00
17,00
15,00
13,00
11,00
9,00
7,00
5,00
3,00
1,00
Valo
r m
édio
das
com
pra
s
130
120
110
100
90
80
70
60
50
40
30
20
10
0
91
Dia do Mês x Valor Total das Compras
Dia do mês da realização da compra
31,00
29,00
27,00
25,00
23,00
21,00
19,00
17,00
15,00
13,00
11,00
9,00
7,00
5,00
3,00
1,00
Valo
r to
tal
da
s c
om
pra
s
6.000.000
5.000.000
4.000.000
3.000.000
2.000.000
1.000.000
0
Gráfico 12 Gráfico de barras do número total, média e valor total de
compras em relação ao dia do mês.
Dia do Mês x
Número de dias desde a última compra
Dia do mês da realização da compra
31,00
29,00
27,00
25,00
23,00
21,00
19,00
17,00
15,00
13,00
11,00
9,00
7,00
5,00
3,00
1,00
Núm
ero
de
dia
s d
esd
e a
últ
ima c
om
pra
20
16
12
8
4
0
Gráfico 13 Gráfico de barras do número de dias desde a última compra
em relação ao dia do mês.
Para estudar melhor a sazonalidade mensal, os dias do mês foram divididos
em dois grupos, conforme a quinzena do mês a que pertencem: o primeiro
reuniu as compras realizadas entre os dias 29 do mês anterior e 13 do mês
estudado e o segundo agrupou as compras realizadas entre os dias 14 e 28 do
mês observado. Esta divisão foi feita em função dos resultados obtidos no
Gráfico 12 e tem por objetivo dividir os dados conforme a proximidade do
pagamento de salários dos clientes. Como normalmente o pagamento de
salários é feito no início do mês, estando dentro do intervalo entre os dias 29 e
13, era esperado que as compras feitas nesta quinzena apresentassem um
valor maior.
92
Dividindo todas as compras conforme a quinzena em que foram realizadas,
pôde-se confirmar que o valor médio das compras é maior entre os dias 29 e
13 (a Tabela 11 mostra as estatísticas descritivas e os percentis para cada
quinzena). A média das compras realizadas entre os dias 29 e 13 é de
R$114,27 e a das compras realizadas entre os dias 14 e 28 é de R$106,19.
Observando os percentis, é possível verificar que este resultado não ocorreu
devido a existência de outliers. Enquanto que entre os dias 14 e 28 cinco por
cento das compras tiveram valores maiores que R$324,50, entre os dias 29 e
13 cinco por cento das compras possuíram valores maiores que R$342,50.
Este deslocamento para a direita da distribuição dos valores das compras na
quinzena que compreende os dias entre 29 e 13 pode ser confirmada no
Gráfico 14, onde são mostrados os histogramas e os P-P plots.
Tabela 11 Estatísticas descritivas e percentis do Valor das compras
para as quinzenas.
dia 14 a 28 dia 29 a 13 Percentis (%) dia 14 a 28 dia 29 a 13
N 584.701 624.500 5 10,50 11,00
Mínimo 5,00 5,00 10 15,00 16,00
Máximo 21.139,00 16.180,00 25 29,50 32,00
Soma 62.088.175 71.362.014 50 64,00 71,00
Média 106,19 114,27 75 133,00 147,00
Desvio Padrão 152,84 154,35 90 233,50 253,00
Assimetria 16,27 12,16 95 324,50 342,50
Erro Padrão ,0032 ,0031
Curtose 1.162,75 611,23
Erro Padrão ,0064 ,0062
93
Valor das compras
48
0 -
50
0
44
0 -
46
0
40
0 -
42
0
36
0 -
38
0
32
0 -
34
0
28
0 -
30
0
24
0 -
26
0
20
0 -
22
0
16
0 -
18
0
12
0 -
14
0
80
- 1
00
40
- 6
0
0 -
20
Histograma
Valor das compras (dia 14 a 28)
Núm
ero
de
casos
1.200
1.000
800
600
400
200
0
P-P Plot exponencial
Valor das compras (dia 14 a 28)
Probabilidade cumulativa observada
1,00,75,50,250,00
Pro
bab
ilida
de
cu
mula
tiva
es
pe
rada
1,00
,75
,50
,25
0,00
Valor das compras
48
0 -
50
0
44
0 -
46
0
40
0 -
42
0
36
0 -
38
0
32
0 -
34
0
28
0 -
30
0
24
0 -
26
0
20
0 -
22
0
16
0 -
18
0
12
0 -
14
0
80
- 1
00
40
- 6
0
0 -
20
Histograma
Valor das compras (dia 29 a 13)
Núm
ero
de
casos
1.200
1.000
800
600
400
200
0
P-P Plot exponencial
Valor das compras (dia 29 a 13)
Probabilidade cumulativa observada
1,00,75,50,250,00
Pro
bab
ilida
de
cu
mula
tiva
es
pe
rada
1,00
,75
,50
,25
0,00
Gráfico 14 Histograma e P-P Plot do valor das compras para as
quinzenas.
A diferença no número de compras e no valor total de compras entre as
duas quinzenas, que pode ser observado no Gráfico 15 e na Tabela 11, não
deve ser levada em consideração devido ao diferente número de dias em cada
grupo. Para contornar este problema, decidiu-se trabalhar com a média diária
de cada quinzena.
Analisando o número de compras por dia entre as duas quinzenas (Tabela
12 e Gráfico 16), é possível perceber que os valores são bastante
semelhantes. A média para a quinzena entre os dias 28 e 13 foi de 3.375
compras por dia e para a outra quinzena a média foi de 3.284. A hipótese de
igualdade de médias é aceita pelo teste ANOVA com um intervalo de confiança
igual a 95%. O valor da estatística F é de 1,86 que equivale a um nível de
significância igual a 0,1729 com 362 graus de liberdade no total.
94
Quinzena x Número de Compras
Se a compra foi feita entre o dia 29 e 13
di a 29 a 13di a 14 a 28
Núm
ero
de
co
mpra
s
650.000
600.000
550.000
500.000
450.000
400.000
350.000
300.000
250.000
200.000
150.000
100.000
50.000
0
Quinzena x Valor Médio da Compra
Se a compra foi feita entre o dia 29 e 13
di a 29 a 13di a 14 a 28V
alo
r m
édio
da c
om
pra
120
100
80
60
40
20
0
Quinzena x Valor Total das Compras
Se a compra foi feita entre o dia 29 e 13
di a 29 a 13di a 14 a 28
Valo
r to
tal
da
s c
om
pra
s
75.000.000
60.000.000
45.000.000
30.000.000
15.000.000
0
Gráfico 15 Gráfico de barras do número total, média e valor total de
compras em relação à quinzena.
Tabela 12 Estatísticas descritivas e percentis do número diário de
compras para as quinzenas.
dia 14 a 28 dia 29 a 13 Percentis (%) dia 14 a 28 dia 29 a 13
N 178 185 5 2.144 2.072
Mínimo 1.633 1.112 10 2.411 2.515
Máximo 5.403 5.083 25 2.944 3.047
Soma 584.701 624.500 50 3.291 3.444
Média 3.284,84 3.375,68 75 3.674 3.780
Desvio Padrão 609,46 655,95 90 3.952 4.120
Assimetria -,0084 -,5862 95 4.323 4.339
Erro Padrão ,1821 ,1787
Curtose ,7357 ,8159
Erro Padrão ,3622 ,3555
95
Quinzena x
Média diária do número de compras
Se a compra foi realizada entre o dia 29 e 13
di a 29 a 13di a 14 a 28
Méd
ia d
iári
a d
o n
úm
ero
de c
om
pra
s
3.500
3.000
2.500
2.000
1.500
1.000
500
0
Gráfico 16 Gráfico de barras do número diário de compras conforme a
quinzena.
Já para o valor médio diário das compras, não se aceita a hipótese de
igualdade entre as quinzenas através de um teste ANOVA. O valor do
coeficiente R2 foi de 0,10 e o valor da estatística F foi de 41,98 que equivale a
um nível de significância igual a 0,0000 com 362 graus de liberdade no total. O
valor médio diário para a quinzena do dia 29 ao dia 13 foi de R$113,63
enquanto que para a outra quinzena o valor médio diário foi de R$105,79. Uma
comparação melhor entre as duas quinzenas pode ser feita analisando-se o
Tabela 13 e Gráfico 17. Analisando os percentis de ambas as distribuições, é
possível perceber que, até o percentil 95%, o valor médio diário das compras
realizadas entre os dias 29 e 13 é consistentemente maior que a da outra
quinzena. Esta diferença só desaparece para percentis maiores que 95%
devido à ocorrência de outliers.
96
Tabela 13 Estatísticas descritivas e percentis do valor médio diário das
compras para as quinzenas.
dia 14 a 28 dia 29 a 13 Percentis (%) dia 14 a 28 dia 29 a 13
N 178 185 5 90,27 95,55
Mínimo 73,51 79,93 10 92,75 100,11
Máximo 157,62 147,19 25 97,39 106,53
Média 105,79 113,63 50 104,18 113,14
Desvio Padrão 12,27 10,75 75 112,10 120,83
Assimetria 1,1975 -,0587 90 118,32 128,25
Erro Padrão ,1821 ,1787 95 131,01 130,89
Curtose 2,8793 ,2755
Erro Padrão ,3622 ,3555
Quinzena x
Média diária do valor médio das compras
Se a compra foi realizada entre o dia 29 e 13
di a 29 a 13di a 14 a 28
Méd
ia d
iári
a d
o v
alo
r m
éd
io d
as c
om
pra
s
120
100
80
60
40
20
0
Gráfico 17 Gráfico de barras do valor médio diário das compras
conforme a quinzena.
Em virtude da diferença de valores médios, também não se aceita a hipótese
de igualdade de valores totais diários entre as quinzenas (Gráfico 18 e Tabela
14). O valor do coeficiente R2 foi de 0,044 e o valor da estatística F foi de 16,14
que equivale a um nível de significância igual a 0,0001 com 362 graus de
liberdade no total. Para a quinzena que compreende os dias entre 14 e 28, o
valor total médio diário é de R$348.809,00 sendo inferior ao da outra quinzena
(R$385.740,00). Esta diferença também pode ser confirmada através da
análise dos percentis, somente para o percentil 5% a quinzena que engloba os
dias entre 14 e 28 apresenta um valor total diário maior.
97
Tabela 14 Estatísticas descritivas e percentis do valor total diário das
compras para as quinzenas.
dia 14 a 28 dia 29 a 13 Percentis (%) dia 14 a 28 dia 29 a 13
N 178 185 5 223.291 214.449
Mínimo 120.039 88.878 10 254.839 276.750
Máximo 720.093 643.284 25 302.405 342.352
Soma 62.088.175 71.362.014 50 342.403 385.102
Média 348.809 385.740 75 384.492 438.134
Desvio Padrão 84.709 90.206 90 446.019 497.133
Assimetria 1,0795 -,2051 95 517.309 533.706
Erro Padrão ,1821 ,1787
Curtose 3,2536 ,9275
Erro Padrão ,3622 ,3555
Quinzena x
Média diária do valor total das compras
Se a compra foi realizada entre o dia 29 e 13
di a 29 a 13di a 14 a 28
Méd
ia d
iári
a d
o v
alo
r to
tal d
as
co
mpra
s
400.000
350.000
300.000
250.000
200.000
150.000
100.000
50.000
0
Gráfico 18 Gráfico de barras do valor total diário das compras conforme
a quinzena.
Voltando a analisar as compras isoladamente, sem agrupá-las por dia, o
Gráfico 19 mostra o gráfico de barras do número de dias entre compras e a
Tabela 15 mostra as estatísticas descritivas e percentis do número de dias
entre compras para as quinzenas. O valor médio do número de dias entre
compras é de 16,14 para a quinzena entre os dias 14 e 28 e 16,80 para a
outra. Estes valores são muito parecidos e esta semelhança pode ser
98
confirmada pela análise dos percentis: a diferença máxima para um mesmo
percenti l entre as duas quinzenas é de dois dias.
Tabela 15 Estatísticas descritivas e percentis do número de dias entre
compras para as quinzenas.
dia 14 a 28 dia 29 a 13 Percentis (%) dia 14 a 28 dia 29 a 13
N 546.366 566.146 5 1 1
Mínimo ,00 ,00 10 2 2
Máximo 357,00 359,00 25 4 4
Média 16,14 16,80 50 7 8
Desvio Padrão 26,57 26,71 75 16 18
Assimetria 4,60 4,27 90 36 37
Erro Padrão ,0033 ,0033 95 61 63
Curtose 28,91 24,85
Erro Padrão ,0066 ,0065
Quinzena x Número de dias entre compras
Se a compra foi feita entre o dia 29 e 13
di a 29 a 13di a 14 a 28
Núm
ero
de
dia
s e
ntr
e c
om
pra
s
18
15
12
9
6
3
0
Gráfico 19 Gráfico de barras do número de dias entre compras conforme
a quinzena.
Observando os histogramas (Gráfico 20) é possível perceber que para as
compras feitas no meio do mês, entre os dias 14 e 28, há uma sazonalidade
semanal um pouco mais forte, representada pela grande quantidade de casos
onde o número de dias entre compras é igual a sete.
99
Número de dias entre compras
38
- 3
9
36
- 3
7
34
- 3
5
32
- 3
3
30
- 3
1
28
- 2
9
26
- 2
7
24
- 2
5
22
- 2
3
20
- 2
1
18
- 1
9
16
- 1
7
14
- 1
5
12
- 1
3
10
- 1
18 -
9
6 -
7
4 -
5
2 -
3
0 -
1
Histograma
Número de dias entre compras (dia 14 a 28)
Núm
ero
de
casos
600
500
400
300
200
100
0
Número de dias entre compras
38
- 3
9
36
- 3
7
34
- 3
5
32
- 3
3
30
- 3
1
28
- 2
9
26
- 2
7
24
- 2
5
22
- 2
3
20
- 2
1
18
- 1
9
16
- 1
7
14
- 1
5
12
- 1
3
10
- 1
18 -
9
6 -
7
4 -
5
2 -
3
0 -
1
Histograma
Número de dias entre compras (dia 29 a 13)
Núm
ero
de
casos
600
500
400
300
200
100
0
Gráfico 20 Histograma do Número de dias entre compras para as
quinzenas.
Voltando a estudar a média diária em cada quinzena, aceita-se a hipótese
de igualdade da média diária do intervalo de tempo desde a última compra para
as duas quinzenas. Aplicando o teste ANOVA, o valor da estatística F foi de
0,31 que equivale a um nível de significância igual a 0,5769 com 361 graus de
liberdade no total.
Observando todas estas características de padrões de compras mensais, é
possível concluir que o valor médio das compras, e por conseqüência o valor
total das compras, é maior no início do mês em função do recebimento de
salários. Porém, não se observa uma diferença no número de compras nem
nos padrões de freqüência às lojas devido ao período do mês. Ou seja,
conforme o mês passa, os clientes continuam comparecendo às lojas, contudo,
fazendo compras de valores menores.
IV.1.3.2. Análise da sazonalidade semanal
O segundo padrão de compras que foi observado na análise de compras ao
longo dos dias do ano foi o semanal. Através das estatísticas descritivas, dos
percentis e dos gráficos de barras (Tabela 16, Tabela 17 e Gráfico 22
respectivamente), pode-se observar que o número de compras varia muito
dependendo do dia. Sábado e terça-feira são os dias que apresentam o maior
número de transações, com 200.040 e 200.646 respectivamente. Este
resultado já poderia ser esperado para sábado, pois muitas pessoas deixam
100
para fazerem as compras da semana neste dia do final de semana, mas não
para terça-feira. Entretanto, há uma explicação para a quantidade de compras
neste dia inesperado: todas as terças-feiras a rede de varejo promove uma
promoção na seção legumes, verduras e frutas. O dia com maior valor médio
de compras também é sábado (R$119,71), entretanto o desvio padrão neste
dia também é o maior (R$161,28). Segunda-feira é o dia com menor valor
médio por compra (R$99,38) e com menor desvio padrão (R$140,67),
caracterizando-se como o dia onde as compras são mais homogêneas.
Analisando o coeficiente de variação, entretanto, sexta-feira é o dia com o
menor valor (1,3368) e quinta-feira é o dia com o maior (1,4435). O Gráfico 21
mostra o coeficiente de variação para os dias da semana. Como conseqüência
da segunda maior quantidade de vendas e do maior valor médio, sábado é o
dia com maior receita total (R$23.946.034,00), seguido pela terça-feira
(R$20.780.362,00). A análise dos percentis também confirma o maior volume
de compras no sábado. Enquanto que neste dia metade das compras possui
valor acima de R$77,50, na sexta-feira metade das compras tem valor acima
apenas de R$69,50.
Tabela 16 Estatísticas descritivas do valor das compras para os dias da
semana.
Domingo Segunda Terça Quarta Quinta Sexta Sábado
N 122.052 174.082 200.464 169.352 166.352 176.859 200.040
Mínimo 5,00 5,00 5,00 5,00 5,00 5,00 5,00
Máximo 17.171 16.047 11.667 9.802 16.180 6.365 21.139
Soma 13.313.473 17.300.112 20.780.362 19.132.092 19.156.010 19.822.108 23.946.034
Média 109,08 99,38 103,66 112,97 115,15 112,08 119,71
Desvio
Padrão 156,67 140,67 142,62 157,77 166,22 149,83 161,28
Coeficiente
de Variação 1,4363 1,4154 1,3758 1,3965 1,4435 1,3368 1,3473
Assimetria 18,08 17,89 12,53 8,92 15,05 7,99 18,13
Erro Padrão
,0070 ,0059 ,0055 ,0060 ,0060 ,0058 ,0055
Curtose 1.319,20 1.288,81 556,13 231,29 820,86 155,57 1.580,32
Erro Padrão
,0140 ,0117 ,0109 ,0119 ,0120 ,0116 ,0110
101
Dia da Semana x Coeficiente de Variação
0,00
0,30
0,60
0,90
1,20
1,50
Domingo Segunda Terça Quarta Quinta Sexta Sábado
Dia da semana da realização da compra
Co
eficie
nte
de
Va
ria
çã
o
Gráfico 21 Gráfico de barras do coeficiente de variação das compras em
relação ao dia da semana.
Tabela 17 Percentis do valor das compras para os dias da semana.
Percentis (%) Domingo Segunda Terça Quarta Quinta Sexta Sábado
5 10,50 10,00 10,50 10,50 10,50 10,50 12,50
10 15,50 14,50 15,00 15,00 15,00 15,50 18,00
25 30,50 27,50 29,00 29,50 30,50 31,00 36,00
50 66,00 59,50 63,50 67,50 69,00 69,50 77,50
75 137,50 125,50 131,50 143,00 146,00 143,50 152,38
90 241,00 223,50 230,00 252,50 256,50 246,00 258,00
95 332,00 307,50 315,00 345,50 353,00 335,50 349,50
Calculando as médias diárias por dia da semana, os resultados são muito
semelhantes. Sábado e terça-feira são os dias com maiores médias diárias de
transações, alcançando uma média superior a 3.800 transações por dia. Na
Tabela 19 e no Gráfico 23 é possível perceber que no sábado o número médio
de compras é de 3.846, na terça-feira é de 3.855, enquanto que na segunda-
feira (o dia com o terceiro maior volume médio) esta média é de 3.481.
Entretanto, sábado e terça-feira também são os dias com maiores desvios
padrões. A análise de percentis (Tabela 18) também confirma o maior número
de compras na terça-feira e no sábado. Enquanto que mais da metade das
terças-feiras tiveram uma quantidade de vendas superior a 3.800, apenas
102
pouco mais de 10% das segundas-feiras tiveram um volume de vendas
superior a este valor.
Dia da Semana x Número de Compras
Dia da semana da realização da compra
Sábado
Sexta
Quinta
Quarta
Terça
Segunda
Domingo
Núm
ero
de
ca
so
s
250.000
200.000
150.000
100.000
50.000
0
Dia da Semana x Valor Médio da Compra
Dia da semana da realização da compra
SábadoSextaQuintaQuartaTerçaSegundaDomingo
Valo
r m
édio
da c
om
pra
150
120
90
60
30
0
Dia da Semana x
Valor Total das Compras
Dia da semana da realização da compra
Sábado
Sexta
Quinta
Quarta
Terça
Segunda
Domingo
Valo
r to
tal
da
s c
om
pra
s
27.000.000
24.000.000
21.000.000
18.000.000
15.000.000
12.000.000
9.000.000
6.000.000
3.000.000
0
Gráfico 22 Gráfico de barras do número total, média e valor total de
compras em relação ao dia da semana.
Tabela 18 Percentis do número médio diário de compras para os dias
da semana.
Percentis (%) Domingo Segunda Terça Quarta Quinta Sexta Sábado
5 1.662 2.883 3.174 2.727 2.788 2.905 3.160
10 1.897 3.101 3.366 2.781 2.854 3.029 3.293
25 2.066 3.285 3.604 2.947 2.940 3.114 3.557
50 2.342 3.465 3.871 3.221 3.164 3.323 3.772
75 2.548 3.736 4.147 3.551 3.387 3.619 4.089
90 2.721 3.812 4.435 3.746 3.606 3.904 4.546
95 2.826 4.086 4.616 3.877 3.884 4.195 4.872
103
Tabela 19 Estatísticas descritivas do número médio diário de compras
para os dias da semana.
Domingo Segunda Terça Quarta Quinta Sexta Sábado
N 53 50 52 52 52 52 52
Mínimo 1.326 2.082 1.112 2.711 2.739 2.774 3.066
Máximo 3.024 4.335 4.840 4.112 4.319 4.666 5.403
Soma 122.052 174.082 200.464 169.352 166.352 176.859 200.040
Média 2.302 3.481 3.855 3.256 3.199 3.401 3.846
Desvio Padrão 343,25 360,64 545,12 366,82 333,79 370,91 479,37
Assimetria -,3923 -,9072 -2,3783 ,2889 1,4112 1,1323 1,0956
Erro Padrão ,3274 ,3366 ,3304 ,3304 ,3304 ,3304 ,3304
Curtose ,1572 3,8063 11,7176 -,8898 2,8897 1,9400 1,6066
Erro Padrão ,6444 ,6619 ,6501 ,6501 ,6501 ,6501 ,6501
Dia da semana x
Média diária do número de compras
Dia da semana da realização da compra
Sábado
Sexta
Quinta
Quarta
Terça
Segunda
Domingo
Méd
ia d
iári
a d
o n
úm
ero
de c
om
pra
s
4.000
3.000
2.000
1.000
0
Gráfico 23 Gráfico de barras do número médio diário de compras em
função do dia da semana.
Os valores médios diários também confirmam as observações anteriores.
Através das estatísticas descritivas mostradas na Tabela 20 e no gráfico de
barras mostrado no Gráfico 24, é possível verificar que sábado é o dia com
maior valor médio de compras (R$119,16) e segunda-feira é o dia com o menor
(R$99,16). A análise dos percentis mostradas na Tabela 21 também confirma
o maior valor médio por compras no sábado. Metade dos sábados tiveram um
valor médio por compras superior a R$117,85, enquanto que na quinta-feira o
valor da mediana é de R$114,15.
104
Tabela 20 Estatísticas descritivas do valor diário médio por compra
para os dias da semana.
Domingo Segunda Terça Quarta Quinta Sexta Sábado
N 53 50 52 52 52 52 52
Mínimo 73,51 81,79 79,93 95,53 93,24 93,31 97,00
Máximo 151,21 129,99 139,24 140,30 157,62 136,45 147,19
Média 108,01 99,16 103,11 112,51 114,62 111,55 119,16
Desvio Padrão 13,21 8,35 9,65 9,84 11,40 8,88 11,02
Assimetria ,4179 ,8123 ,7955 ,4891 1,2657 ,3965 ,1669
Erro Padrão ,3274 ,3366 ,3304 ,3304 ,3304 ,3304 ,3304
Curtose 1,5494 2,5242 2,6193 ,0871 3,2053 -,0257 -,2364
Erro Padrão ,6444 ,6619 ,6501 ,6501 ,6501 ,6501 ,6501
Tabela 21 Percentis do valor diário médio por compra para os dias da
semana.
Percentis (%) Domingo Segunda Terça Quarta Quinta Sexta Sábado
5 88,43 87,03 91,17 96,78 99,03 99,69 98,70
10 93,97 88,76 92,23 100,39 102,79 100,47 104,40
25 99,01 94,11 96,62 104,96 106,75 103,88 112,05
50 107,46 97,96 102,12 111,61 114,15 111,58 117,85
75 115,38 104,20 109,90 119,88 119,56 118,11 126,16
90 124,09 107,53 113,89 124,89 130,14 123,76 134,76
95 130,08 112,18 116,35 131,83 135,63 126,72 136,75
Dia da semana x
Média diária do valor médio das compras
Dia da semana da realização da compra
SábadoSextaQuintaQuartaTerçaSegundaDomingo
Méd
ia d
iári
a d
o v
alo
r m
éd
io d
as c
om
pra
s
140
120
100
80
60
40
20
0
Gráfico 24 Gráfico de barras do valor diário médio por compra em
função do dia da semana.
105
Em função do resultados obtidos anteriormente, maior quantidade e maior
valor médio, sábado é o dia com maior média diária de receitas: R$460.500,00.
Este valor é mais de 15% superior à média da terça-feira (dia com a segunda
maior média). Segunda-feira é o dia com menor valor total médio de vendas
(R$346.002,00) mas com o menor desvio padrão. O Gráfico 25 mostra o
gráfico de barras do valor diário total de compras em função do dia da semana,
a Tabela 22 exibe as estatísticas descritivas e a Tabela 23 mostra os percentis.
Tabela 22 Estatísticas descritivas do valor diário total de compras para
os dias da semana.
Domingo Segunda Terça Quarta Quinta Sexta Sábado
N 53 50 52 52 52 52 52
Mínimo 120.039 200.540 88.878 278.126 255.381 274.992 300.539
Máximo 457.261 537.360 642.026 556.006 615.838 636.654 720.093
Soma 13.313.473 17.300.112 20.780.362 19.132.091 19.156.010 19.822.107 23.946.034
Média 251.197 346.002 399.622 367.924 368.384 381.194 460.500
Desvio
Padrão 60.587 53.032 75.522 63.599 65.820 66.014 85.036
Assimetria ,6355 ,7606 -,6265 ,7993 1,3924 1,4260 ,7970
Erro Padrão ,3274 ,3366 ,3304 ,3304 ,3304 ,3304 ,3304
Curtose 1,6511 3,8482 6,1545 ,5434 2,9041 3,5165 ,7107
Erro Padrão ,6444 ,6619 ,6501 ,6501 ,6501 ,6501 ,6501
Tabela 23 Percentis do valor diário total de compras para os dias da
semana.
Percentis (%) Domingo Segunda Terça Quarta Quinta Sexta Sábado
5 147.495 260.699 305.635 288.211 287.735 285.674 343.440
10 184.625 293.416 324.488 293.707 305.286 314.731 362.872
25 212.149 318.337 357.687 305.724 324.617 340.323 401.713
50 244.855 342.769 397.174 362.601 350.682 369.419 439.630
75 283.390 368.159 438.720 403.768 394.053 420.086 524.146
90 337.625 401.362 468.699 453.477 460.620 454.981 563.476
95 349.304 445.896 525.698 505.377 503.278 515.266 635.222
106
Dia da semana x
Média diária do valor total das compras
Dia da semana da realização da compra
Sábado
Sexta
Quinta
Quarta
Terça
Segunda
Domingo
Méd
ia d
iári
a d
o v
alo
r to
tal d
as
co
mpra
s
500.000
400.000
300.000
200.000
100.000
0
Gráfico 25 Gráfico de barras do valor diário total de compras em função
do dia da semana.
Em todas estas comparações o teste ANOVA rejeita a hipótese de igualdade
de valores dos valores médios diários em função do dia de semana.
Voltando a analisar todas as compras sem calcular a média diária, pode-se
perceber que o padrão de freqüência também é diferente em função do dia da
semana (Tabela 24, Tabela 25 e Gráfico 26). O intervalo médio desde a última
compra e o seu desvio padrão são menores na segunda-feira (14,95 e 23,61
respectivamente) e na terça-feira (15,07 e 24,08 respectivamente), indicando
que os clientes que fazem compras nestes dias apresentam um
comportamento mais regular. Em compensação, no sábado e no domingo
estes valores são maiores, indicando que os clientes que escolhem estes dias
para fazerem suas compras não são tão fiéis. Estas observações podem ser
comprovadas também na análise dos percentis que é menos sensível a outliers
do que as estatísticas descritivas. É interessante notar que quarta-feira, quinta-
feira e sexta-feira apresentam valores para as estatísticas descritivas e para os
percentis dos intervalos entre compras muito semelhantes, indicando uma
possível similaridade no padrão de compras dos clientes que preferem estes
dias.
Observando os histogramas do intervalo de tempo desde a última compra
(Gráfico 27) fica mais clara a diferença na freqüência de compras conforme os
dias da semana. O histograma revela que para as compras feitas no domingo,
107
há uma quantidade substancial de casos em que o intervalo desde a última
compra é de 7 e 8 dias, que corresponde ao final de semana anterior. No
sábado há uma grande quantidade de compras feitas com um intervalo de 7
dias. Estes dois histogramas levam à uma conclusão: há um grupo grande de
clientes que preferem realizar suas compras somente no final de semana. Na
terça-feira também é possível perceber uma grande concentração de compras
co intervalo de uma semana. Devido à promoção que acontece neste dia
muitos clientes deixam para fazerem suas compras somente neste dia. Nos
demais dias da semana é possível verificar um fenômeno inverso: em vez de
terem um dia de preferência, os clientes têm um dia em que têm aversão a
fazerem compras. São poucos os casos onde compras feitas em um dia da
semana tiveram sua compra anterior feita em um domingo. Para exemplificar,
no histograma da quarta-feira é possível observar que os intervalos de 3 e 10
dias apresentam poucos casos, e estes intervalos correspondem exatamente a
domingos.
Tabela 24 Estatísticas descritivas do número de dias entre compras
para os dias da semana.
Domingo Segunda Terça Quarta Quinta Sexta Sábado
N 110.315 160.175 185.760 156.190 153.633 164.081 182.358
Mínimo 0 0 0 0 0 0 0
Máximo 353 344 352 357 353 359 359
Média 19,55 14,95 15,07 15,81 15,83 16,00 18,95
Desvio Padrão 30,60 23,61 24,08 25,74 26,09 27,00 29,51
Assimetria 3,86 4,72 4,81 4,45 4,51 4,59 4,03
Erro Padrão ,0074 ,0061 ,0057 ,0062 ,0062 ,0060 ,0057
Curtose 19,78 31,31 32,43 27,26 27,84 28,56 21,91
Erro Padrão ,0147 ,0122 ,0114 ,0124 ,0125 ,0121 ,0115
108
Tabela 25 Percentis do número de dias entre compras para os dias da
semana.
Percentis (%) Domingo Segunda Terça Quarta Quinta Sexta Sábado
5 1 2 1 1 1 1 1
10 2 2 2 1 2 2 2
25 4 4 4 4 3 3 4
50 9 7 7 7 7 7 8
75 21 16 15 16 16 16 21
90 46 33 33 35 35 36 43
95 76 54 55 60 59 61 71
Dia da Semana x
Número de dias entre compras
Dia da semana da realização da compra
SábadoSextaQuintaQuartaTerçaSegundaDomingo
Núm
ero
de
dia
s e
ntr
e c
om
pra
s
21
18
15
12
9
6
3
0
Gráfico 26 Gráfico de barras do número de dias entre compras conforme
o dia da semana.
Número de dias entre compras
38
- 3
9
36
- 3
7
34
- 3
5
32
- 3
3
30
- 3
1
28
- 2
9
26
- 2
7
24
- 2
5
22
- 2
3
20
- 2
1
18
- 1
9
16
- 1
7
14
- 1
5
12
- 1
3
10
- 1
18 -
9
6 -
7
4 -
5
2 -
3
0 -
1
Histograma
Número de dias entre compras (domingo)
Núm
ero
de
casos
210
180
150
120
90
60
30
0
Número de dias entre compras
38
- 3
9
36
- 3
7
34
- 3
5
32
- 3
3
30
- 3
1
28
- 2
9
26
- 2
7
24
- 2
5
22
- 2
3
20
- 2
1
18
- 1
9
16
- 1
7
14
- 1
5
12
- 1
3
10
- 1
18 -
9
6 -
7
4 -
5
2 -
3
0 -
1
Histograma
Número de dias entre compras (segunda)
Núm
ero
de
casos
210
180
150
120
90
60
30
0
109
Número de dias entre compras
38
- 3
9
36
- 3
7
34
- 3
5
32
- 3
3
30
- 3
1
28
- 2
9
26
- 2
7
24
- 2
5
22
- 2
3
20
- 2
1
18
- 1
9
16
- 1
7
14
- 1
5
12
- 1
3
10
- 1
18 -
9
6 -
7
4 -
5
2 -
3
0 -
1
Histograma
Número de dias entre compras (terça)
Núm
ero
de
casos
210
180
150
120
90
60
30
0
Número de dias entre compras
38
- 3
9
36
- 3
7
34
- 3
5
32
- 3
3
30
- 3
1
28
- 2
9
26
- 2
7
24
- 2
5
22
- 2
3
20
- 2
1
18
- 1
9
16
- 1
7
14
- 1
5
12
- 1
3
10
- 1
18 -
9
6 -
7
4 -
5
2 -
3
0 -
1
Histograma
Número de dias entre compras (quarta)
Núm
ero
de
casos
210
180
150
120
90
60
30
0
Número de dias entre compras
38
- 3
9
36
- 3
7
34
- 3
5
32
- 3
3
30
- 3
1
28
- 2
9
26
- 2
7
24
- 2
5
22
- 2
3
20
- 2
1
18
- 1
9
16
- 1
7
14
- 1
5
12
- 1
3
10
- 1
18 -
9
6 -
7
4 -
5
2 -
3
0 -
1
Histograma
Número de dias entre compras (quinta)
Núm
ero
de
casos
210
180
150
120
90
60
30
0
Número de dias entre compras
38
- 3
9
36
- 3
7
34
- 3
5
32
- 3
3
30
- 3
1
28
- 2
9
26
- 2
7
24
- 2
5
22
- 2
3
20
- 2
1
18
- 1
9
16
- 1
7
14
- 1
5
12
- 1
3
10
- 1
18 -
9
6 -
7
4 -
5
2 -
3
0 -
1
Histograma
Número de dias entre compras (sexta)
Núm
ero
de
ca
sos
210
180
150
120
90
60
30
0
Número de dias entre compras
38
- 3
9
36
- 3
7
34
- 3
5
32
- 3
3
30
- 3
1
28
- 2
9
26
- 2
7
24
- 2
5
22
- 2
3
20
- 2
1
18
- 1
9
16
- 1
7
14
- 1
5
12
- 1
3
10
- 1
18 -
9
6 -
7
4 -
5
2 -
3
0 -
1
Histograma
Número de dias entre compras (sábado)
Núm
ero
de
casos
210
180
150
120
90
60
30
0
Gráfico 27 Histograma do Número de dias entre compras para as
quinzenas.
Analisando o gráfico de barras que relaciona o dia da semana da realização
da compra com o dia da compra anterior (Gráfico 28) é possível confirmar
algumas das características sazonais já observadas. Das 200.040 compras
realizadas nos sábados, em mais de 40.000 os clientes haviam feito sua
compra anterior em um outro sábado. Este valor corresponde a mais de 20%
110
das compras. No domingo e na terça-feira também se observa este fenômeno
de compras seguidas em um mesmo dia da semana. Nos dias de semana é
possível observar a aversão aos domingos.
Dia da semana da compra anterior
Dia da semana da realização da compra
Sábado
Sexta
Quinta
Quarta
Terça
Segunda
Domingo
Nú
mero
de c
asos
50.000
40.000
30.000
20.000
10.000
0
Compra anterior
Domingo
Segunda
Terça
Quarta
Quinta
Sexta
Sábado
Gráfico 28 Gráfico de barras com o dia da semana da compra anterior
conforme o dia da semana.
Resumindo todas as informações obtidas, as principais características dos
dias da semana são:
a. Sábado – Muitos clientes escolheram este dia como o dia em que
preferem fazer suas compras. Por isso, este dia possui forte
sazonalidade semanal, mas o intervalo médio desde a última compra é
maior que a média dos outros dias. Os valores médios das compras são
os maiores mas também são os mais heterogêneos;
b. Domingo – O intervalo médio desde a última compra neste dia é maior
que a média dos outros dias, e os valores médios das compras são
baixos. É o dia com menor volume de vendas. Também apresenta uma
grande heterogeneidade de clientes;
c. Segunda-feira – Apresenta o menor intervalo médio desde a última
compra significando que pode ser o dia escolhido pelos clientes mais fiéis
e homogêneos. Entretanto, os valores médios das compras são os
menores;
111
d. Terça-feira – Apresenta uma grande freqüência de compras, com um
baixo intervalo desde a última compra. Os valores médios das compras
são baixos. É o dia com o segundo maior volume de compras, sendo que
esta característica pode ser uma conseqüência da promoção que existe
neste dia da semana;
e. Quarta-feira, quinta-feira e sexta-feira – Apresentam basicamente as
mesmas características. São os dias que não possuem valores extremos
nem para a freqüência nem para o valor médio das compras.
IV.1.4. Análise por loja
Apesar de já terem sido detectado alguns padrões de comportamento entre
as compras da rede de varejo, é de se esperar que este comportamento não
seja o mesmo se elas fossem separadas por lojas. Com o intuito de detectar
essas possíveis diferenças, as quatro lojas da rede foram analisadas
separadamente para poderem ser comparadas.
As quatro lojas não apresentam a mesma participação no volume de vendas
da empresa. Duas das lojas são responsáveis por mais de 80% do número de
compras (Gráfico 29). O valor médio de cada compra também é diferente por
loja. Há uma loja que possui a média consideravelmente menor que a das
outras. É interessante notar que esta loja é uma das duas que tem um grande
volume de vendas. Deste modo, a outra loja com bom volume de vendas e
elevado valor médio por compra se destaca como a geradora da maior parte da
receita total da empresa, quase 50%.
Observando o número médio de dias entre compras por cliente de cada loja
(Gráfico 30), é possível começar entender porque uma loja possui o valor
médio por compra menor que as outras. Esta loja é a que possui o menor
intervalo tempo médio entre compras, indicando que seus clientes sejam mais
fiéis e freqüentes. Para confirmar esta hipótese o Gráfico 31 mostra o número
de clientes e o número médio de compras por cliente para cada loja. Antes de
se fazer qualquer comentário é necessário explicar que não foi feita nenhuma
seleção de outliers na contagem do número de clientes. Clientes que fizeram
112
suas compras em uma determinada loja, mas que alguma vez também
adquiriram algum produto em outra loja, foram considerados consumidores dos
dois estabelecimentos. Neste gráfico é possível perceber que a loja que possui
a maior receita total é a que possui o maior número de clientes. Em
compensação, a loja que tem o menor valor médio por compra possui uma
quantidade de clientes reduzida, mas que fazem compras freqüentemente. O
número de clientes desta loja é quase o mesmo que o das duas lojas que têm
participação irrisória na receita total, mas devido à freqüência de seus clientes,
que é quase o dobro da média das outras lojas, a sua participação na receita
total chega a aproximadamente 30%.
Lojas x Número de compras
Número do estabelecimento
Loja 4Loja 3Loja 2Loja 1
Núm
ero
de
co
mpra
s
600.000
500.000
400.000
300.000
200.000
100.000
0
Loja x Valor médio da compra
Número do estabelecimento
Loja 4Loja 3Loja 2Loja 1
Valo
r m
édio
da c
om
pra
150
120
90
60
30
0
Loja x Valor Total das Compras
Número do estabelecimento
Loja 4Loja 3Loja 2Loja 1
Valo
r T
ota
l da
s C
om
pra
s
70.000.000
60.000.000
50.000.000
40.000.000
30.000.000
20.000.000
10.000.000
0
Gráfico 29 Gráfico de barras do número total, média e valor total de
compras por loja.
113
Loja x Número de dias entre compras
Número do estabelecimento
Loja 4Loja 3Loja 2Loja 1
Núm
ero
de
dia
s e
ntr
e c
om
pra
s24
20
16
12
8
4
0
Gráfico 30 Gráfico de barras do número de dias entre compras por loja.
Loja x Número de clientes
Número do estabelecimento
Loja 4Loja 3Loja 2Loja 1
Núm
ero
de
clien
tes
60.000
50.000
40.000
30.000
20.000
10.000
0
Loja x
Média do número de compras por cliente
Número do estabelecimento
Loja 4Loja 3Loja 2Loja 1
Méd
ia d
o n
úm
ero
de
co
mpra
s p
or
clie
nte
20
16
12
8
4
0
Gráfico 31 Gráfico de barras com o número de clientes e a média do
número de compras por cliente para cada loja.
Mês do ano x
Número de compras por loja
Mês da realização da compra
Dezembro
Novembro
Outubro
Setembro
Agosto
Julho
Junho
Maio
Abril
Março
Feverei ro
Janeiro
Núm
ero
de
co
mpra
s
60.000
50.000
40.000
30.000
20.000
10.000
0
Loja
Loja 1
Loja 2
Loja 3
Loja 4
Mês do ano x
Valor médio da compra por loja
Mês da realização da compra
Dezembro
Novembro
Outubro
Setembro
Agosto
Julho
Junho
Maio
Abril
Março
Feverei ro
Janeiro
Valo
r m
édio
das
com
pra
s
160
120
80
40
0
Loja
Loja 1
Loja 2
Loja 3
Loja 4
114
Mês do ano x Valor total das compras
Mês da realização da compra
Dezembro
Novembro
Outubro
Setembro
Agosto
Julho
Junho
Maio
Abril
Março
Feverei ro
Janeiro
Valo
r to
tal
da
s c
om
pra
s
7.000.000
6.000.000
5.000.000
4.000.000
3.000.000
2.000.000
1.000.000
0
Loja
Loja 1
Loja 2
Loja 3
Loja 4
Gráfico 32 Evolução do número total, média e valor total de compras por
loja ao longo dos meses do ano.
Analisando a evolução do número de compras, do valor médio e do valor
total das compras ao longo do ano (Gráfico 32), é possível perceber que não
houve nenhuma alteração nas relações entre as lojas. A loja que teve o maior
número de vendas e a maior receita total não foi alcançada em nenhum mês, e
a loja com menor valor médio por compra não esboçou nenhuma mudança
neste padrão ao longo do ano.
Loja x
Número de compras por dia da semana
Número do estabelecimento
Loja 4Loja 3Loja 2Loja 1
Núm
ero
de c
om
pra
s
100.000
80.000
60.000
40.000
20.000
0
Dia da semana
Domingo
Segunda
Terça
Quarta
Quinta
Sexta
Sábado
Loja x Valor médio das compras
por dia da semana
Número do estabelecimento
Loja 4Loja 3Loja 2Loja 1
Va
lor
mé
dio
da
s c
om
pra
s
150
120
90
60
30
0
Dia da semana
Domingo
Segunda
Terça
Quarta
Quinta
Sexta
Sábado
Gráfico 33 Gráfico de barras com o número total e o valor médio das
compras por dia da semana para cada loja.
115
Loja x Número de dias entre compras
por dia da semana
Número do estabelecimento
Loja 4Loja 3Loja 2Loja 1
Nú
me
ro d
e d
ias e
ntr
e c
om
pra
s
30
25
20
15
10
5
0
Dia da semana
Domingo
Segunda
Terça
Quarta
Quinta
Sexta
Sábado
Gráfico 34 Gráfico de barras com o número médio de dias entre
compras por loja.
Comparando o padrão de compras ao longo dos dias da semana entre as
lojas (Gráfico 33 e Gráfico 34), é possível perceber que sábado é um dia forte
nas vendas em todas elas. Entretanto, nas duas principais lojas, terça-feira
feira também se destaca devido à promoção na seção de frutas, legumes e
verduras. Em todas as lojas, os dias com maior intervalo entre compras são
sábado e domingo. Este padrão está presente inclusive na loja onde os clientes
são mais freqüentes.
Havia uma dúvida se a evolução das compras por dia da semana poderia
variar em função da loja e da quinzena. O Gráfico 35 mostra esta comparação
para o número e o valor médio das compras entre as duas principais lojas da
rede. Quanto ao número de compras por dia da semana, é possível observar
que na quinzena entre os dias 28 e 13 (quando as pessoas recebem seus
salários) o volume aos sábados é maior que na outra quinzena. Este fato
ocorre nas duas lojas, entretanto, na loja 2, mesmo nesta quinzena, terça-feira
continua sendo o dia com maior número de compras. Outra diferença entre as
duas lojas é o volume de vendas na segunda-feira, na loja 2 na quinzena entre
28 e 13 ele é significativamente maior que nos outros dias úteis (exceto terça-
feira).
Comparando o valor médio das compras, é mais difícil perceber alguma
diferença entre as lojas. Só é possível perceber que na loja 2 o valor médio na
116
quinta-feira, comparando-se com os outros dias da semana, é maior que na
loja 1.
Quinzena x
Número de compras por dia da semana
Loja 1
Se a compra foi feita entre o dia 29 e 13
di a 29 a 13di a 14 a 28
Núm
ero
de
co
mpra
s
50.000
40.000
30.000
20.000
10.000
0
Dia da semana
Domingo
Segunda
Terça
Quarta
Quinta
Sexta
Sábado
Quinzena x Valor médio das compras
por dia da semana
Loja 1
Se a compra foi feita entre o dia 29 e 13
di a 29 a 13di a 14 a 28
Valo
r m
édio
das
com
pra
s
150
120
90
60
30
0
Dia da semana
Domingo
Segunda
Terça
Quarta
Quinta
Sexta
Sábado
Quinzena x
Número de compras por dia da semana
Loja 2
Se a compra foi feita entre o dia 29 e 13
di a 29 a 13di a 14 a 28
Núm
ero
de
co
mpra
s
50.000
40.000
30.000
20.000
10.000
0
Dia da semana
Domingo
Segunda
Terça
Quarta
Quinta
Sexta
Sábado
Quinzena x Valor médio das compras
por dia da semana
Loja 2
Se a compra foi feita entre o dia 29 e 13
di a 29 a 13di a 14 a 28
Valo
r m
édio
das
com
pra
s
150
120
90
60
30
0
Dia da semana
Domingo
Segunda
Terça
Quarta
Quinta
Sexta
Sábado
Gráfico 35 Comparação entre o número de compras e o seu valor médio
entre as duas principais lojas em função da quinzena e do dia
da semana.
Em função de todos estes resultados obtidos ao se comparar a performance
de cada loja separadamente, é interessante notar que mesmo pertencendo à
mesma rede de varejo os seus padrões de compras são bastante diferentes. A
loja 1, mesmo não sendo a mais importante em receita, apresenta um caso
interessante devido ao seu menor número de clientes, que, entretanto, são
mais fiéis. Esta fidelidade pode compensar o menor volume de vendas na
medida que não é necessário fazer tanta propaganda para manter estes
clientes. A empresa deveria estudar cuidadosamente porque esta loja
apresenta um relacionamento muito mais forte com os seus clientes do que as
outras. Será que foram promoções, iniciativas da loja ou simplesmente
117
características do mercado local que proporcionaram esta fidelização?
Respondendo estas perguntas, a companhia poderia tentar replicar esta
característica de sucesso nas outras lojas do grupo.
IV.2. ANÁLISE DOS CLIENTES
Até o momento, somente as compras foram analisadas. Através delas é
possível inferir alguns padrões recorrentes, mas não se é capaz de diferenciar
os clientes individualmente. Conhecer a característica de cada um possibilita a
comunicação personalizada, permitindo a construção e a manutenção de um
relacionamento, quando este for interessante para eles e para a empresa. A
partir de agora, o objeto de estudo passa a ser os clientes e quais são os seus
padrões de compras. Perguntas como quais são os mais freqüentes, quais os
que fazem mais compras e qual a loja que eles preferem tentaram ser
respondidas. Somente através destas respostas é possível para a firma
construir um relacionamento duradouro com os seus clientes.
IV.2.1. Análise geral de todos os clientes
Antes de se tentar fazer qualquer segmentação dos clientes, é interessante
analisar todos ao mesmo tempo. Foram 96.689 clientes que fizeram compras
na rede de varejo e utilizaram o cartão de fidelização. Entretanto, muitos deles
fizeram poucas compras e não devem ser considerados clientes usuais da
empresa. Por isso, só foram estudados os consumidores que fizeram pelo
menos 12 compras nas lojas da rede ao longo do ano de 2000. Fazendo este
corte, foi estudado o comportamento de compra de 32.576 pessoas.
A pessoa que fez o maior número de compras fez 310 aquisições. Esta
freqüência é muito elevada, quase uma vez a cada 1,17 dias em que as lojas
estiveram abertas. Este valor pode ser uma fraude e a empresa deveria tentar
descobrir que é esta pessoa. No total, estes clientes fizeram 953.258 compras,
uma média superior a 2.600 por dia. Cada cliente fez em média 29,26 compras
no ano, ou seja, uma vez a cada 12,4 dias. Somente 10% dos clientes têm uma
média de compras superior a 53 compras por ano, o que seria equivalente a
118
uma compra por semana. Outros 10% fizeram menos do que 13 compras, o
que equivale a praticamente uma compra por mês. Estes valores podem se
verificados nas estatísticas descritivas e na análise de percentis apresentados
na Tabela 26.
Tabela 26 Estatísticas descritivas e percentis do Número de compras
por cliente.
Estatística Erro padrão Percentis (%) Valor
Número de casos 32.576 5 12
Mínimo 12 10 13
Máximo 310 25 16
Soma 953.258 50 23
Média 29,26 75 36
Moda 12 90 53
Desvio Padrão 19,55 95 66
Assimetria 2,62 ,0136
Curtose 12,43 ,0271
A distribuição do número de compras por cliente se assemelha muito com
uma exponencial. A principal diferença que pode ser notada no histograma
(Gráfico 36) é o corte dos clientes que não fizeram no mínimo 12 compras no
ano. Este fato da distribuição apresentar uma forma exponencial é uma
característica interessante para a empresa pois significa que há um grupo
seleto de clientes que é responsável por um percentual elevado de todas as
compras da rede. A firma deve tentar descobrir quem são estes clientes
especiais que fazem compras freqüentemente e tentar construir um
relacionamento com eles.
119
Número de compras
11
2 -
11
6
10
4 -
10
8
96
- 1
00
88
- 9
2
80
- 8
4
72
- 7
6
64
- 6
8
56
- 6
0
48
- 5
2
40
- 4
4
32
- 3
6
24
- 2
8
16
- 2
0
8 -
12
0 -
4
Histograma
Número de compras
Núm
ero
de
casos
8.000
6.000
4.000
2.000
0
Gráfico 36 Histograma do Número de compras por cliente.
Gráfico de Pareto para
o número de compras
Percentual dos clientes
,96
,91
,86
,81
,76
,71
,66
,61
,56
,51
,46
,41
,36
,31
,26
,21
,16
,11
,06
,01
Perc
en
tual
do
núm
ero
de
co
mpra
s t
ota
l
1,00
,80
,60
,40
,20
0,00
Gráfico 37 Gráfico de Pareto para o número de compras.
O Gráfico 37 mostra o gráfico de Pareto entre o número de clientes e o de
compras. É possível verificar que apenas 20% dos clientes são responsáveis
por 40% das compras e que apenas 28% dos clientes respondem por mais de
50% do volume de vendas. Apesar de já ser bastante expressivo, é
interessante lembrar que este resultado não leva em conta os clientes que
fizeram menos de 12 compras ao longo do ano.
As estatísticas descritivas e os percentis do valor médio das compras por
cliente estão mostrados na Tabela 27. É possível verificar que o valor médio
das compra por cliente foi de R$112,73, mas a amplitude é muito alta sendo
que o pior cliente tem um valor médio de compra igual a R$8,13 e o melhor
120
R$5.791,42. Por este motivo, o desvio padrão tem quase o mesmo valor que a
média: R$87,86. A moda da distribuição foi R$94,50. Mais de 10% dos clientes
tiveram um valor médio por compra acima de R$200,00. Levando-se em conta
que estes clientes foram no mínimo 12 vezes à loja durante o ano, estes
clientes certamente gastaram mais de R$2.400,00 nas lojas da rede durante o
ano. Estes também são clientes especiais que deveriam receber um tratamento
especial.
Tabela 27 Estatísticas descritivas e percentis do Valor médio das
compras por cliente.
Estatística Erro padrão Percentis (%) Valor
Número de casos 32.576 5 31,39
Mínimo 8,13 10 40,54
Máximo 5.791,42 25 61,09
Média 112,73 50 94,08
Moda 94,50 75 141,48
Desvio Padrão 87,86 90 201,55
Assimetria 12,09 ,0136 95 250,06
Curtose 587,69 ,0271
O histograma do valor médio de compras por cliente se assemelha muito
com a distribuição lognormal. O Gráfico 38 mostra, além do histograma, o P-P
Plot comparativo com a distribuição lognormal, onde é possível observar a
semelhança entre ambas. Novamente é possível perceber que apenas uma
parcela dos clientes é responsável pelas maiores médias por compras.
121
Valor médio das compras
48
0 -
50
0
44
0 -
46
0
40
0 -
42
0
36
0 -
38
0
32
0 -
34
0
28
0 -
30
0
24
0 -
26
0
20
0 -
22
0
16
0 -
18
0
12
0 -
14
0
80
- 1
00
40
- 6
0
0 -
20
Histograma
Valor médio das compras
Núm
ero
de
casos
6.000
5.000
4.000
3.000
2.000
1.000
0
P-P Plot Lognormal
Valor médio das compras
Probabilidade cumulativa observada
1,00,75,50,250,00
Pro
bab
ilida
de
cu
mula
tiva
es
pe
rada
1,00
,75
,50
,25
0,00
Gráfico 38 Histograma e P-P Plot do Valor médio das compras por
cliente.
Analisando agora o gasto total por cliente ao longo de 2000, a Tabela 28
mostra as estatísticas descritivas e os percentis do valor total das compras por
cliente. O cliente que mais gastou nas lojas da rede adquiriu R$78.693,00 em
compras. Este valor é extremamente elevado e se não for uma fraude, deve ser
resultado de compras de eletrodomésticos ou eletro-eletrônicos. Na média, os
clientes gastaram R$3.009,62 no ano, que corresponde a pouco mais de
R$250,00 por mês. Em compensação, 50% dos clientes consumiram mais de
R$2.370,25 e 10% compraram mais de R$5.723.95, que equivale a mais de
R$475,00 por mês.
Tabela 28 Estatísticas descritivas e percentis do Valor total das
compras por cliente.
Estatística Erro padrão Percentis (%) Valor
Número de casos 32.576 5 648,92
Mínimo 127,00 10 881,50
Máximo 78.693 25 1.424,50
Soma 98.041.466 50 2.370,25
Média 3.009 75 3.803,50
Moda 967,00 90 5.723,95
Desvio Padrão 2.697 95 7.305,28
Assimetria 6,28 ,0136
Curtose 101,74 ,0271
122
A distribuição do valor total também se assemelha muito com um lognormal,
fato que pode ser observado através do histograma e do P-P Plot (Gráfico 39).
Valor total das compras
14
.000 -
14
.500
13
.000 -
13
.500
12
.000 -
12
.500
11
.000 -
11
.500
10
.000 -
10
.500
9.0
00 - 9
.500
8.0
00 - 8
.500
7.0
00 - 7
.500
6.0
00 - 6
.500
5.0
00 - 5
.500
4.0
00 - 4
.500
3.0
00 - 3
.500
2.0
00 - 2
.500
1.0
00 - 1
.500
0 -
500
Histograma
Valor total das compras
Núm
ero
de
casos
5.000
4.000
3.000
2.000
1.000
0
P-P Plot Lognormal
Valor total das compras
Probabilidade cumulativa observada
1,00,75,50,250,00
Pro
bab
ilida
de
cu
mula
tiva
es
pe
rada
1,00
,75
,50
,25
0,00
Gráfico 39 Histograma e P-P Plot do Valor total das compras por cliente.
Gráfico de Pareto para
o valor total das compras
Percentual dos clientes
,96
,91
,86
,81
,76
,71
,66
,61
,56
,51
,46
,41
,36
,31
,26
,21
,16
,11
,06
,01
Perc
en
tual
do
valo
r to
tal
da
s c
om
pra
s
1,00
,80
,60
,40
,20
0,00
Gráfico 40 Gráfico de Pareto para o valor total das compras
O Gráfico 40 mostra o gráfico de Pareto entre o valor total das compras e o
número de clientes. É possível verificar que apenas 22% dos clientes são
responsáveis por metade das receitas. Estes são os clientes que deveriam
receber uma atenção especial da empresa.
Repetindo a tentativa de se montar uma regressão que explique o valor
médio das compras pela freqüência com que o cliente vai a loja, os resultados
obtidos foram melhores mas continuam sendo não significativos. O poder de
explicação do valor médio das compras através do número de compras do
cliente é muito baixo. A correlação entre ambos, que pode ser visto na Tabela
123
29 como coeficiente beta, é de apenas –0,1683. A correlação negativa significa
que a medida que o cliente faz mais compras, o valor médio da compra diminui.
Tabela 29 Regressão Número de compras por cliente x Valor médio das
compras por cliente.
Coeficientes a
(Constante) Número de
compras
Coeficientes não padronizados
B 134,86 -,76
Erro padrão ,8639 ,0245
Coeficientes padronizados Beta -,1683
T 156,11 -30,81
Significância. ,0000 ,0000
Intervalo de confiança 95% para B
Limite inferior 133,17 -,80
Limite superior 136,55 -,71
a Variável dependente: Valor médio das compras
Ficou claro nestes estudos que há um grupo de clientes mais lucrativo e fiel.
O próximo passo foi tentar descobrir se há algum padrão de compra que torne
possível identificar estes clientes. Estes padrões podem ser o período do mês,
o dia da semana ou a loja onde preferem fazer suas compras.
IV.2.2. Segmentação por período do mês
O primeiro critério de segmentação tem por objetivo verificar se é possível
identificar os principais clientes da organização através do período do mês em
que concentram suas compras. Serão utilizadas as mesmas quinzenas da
análise das compras: entre os dias 14 e 28 do mesmo mês e entre o dia 29 do
mês anterior e o dia 13. Se o consumidor tiver mais de 70% do valor total de
suas compras em uma destas quinzenas ele será classificado como cliente da
mesma, caso ele não concentre suas compras ele será classificado como „Sem
quinzena‟.
A Tabela 30 mostra as estatísticas descritivas e os percentis do número de
compras conforme a segmentação por quinzena e o Gráfico 41 exibe o gráfico
de barras do número, média e valor total de compras conforme a segmentação
124
por quinzena. Os clientes que preferem realizar suas compras entre os dias 29
e 13 têm uma freqüência de compras um pouco maior que os clientes que
preferem o meio e o final do mês, 21,42 contra 19,75 respectivamente.
Entretanto, estes que pertencem a uma das duas quinzenas realizam, na
média, um número menor de compras que os compradores que foram
classificados como „Sem quinzena‟ (31,39). Esta freqüência menor de compras
pode ser observada também nos percentis. Na verdade, apenas 20% dos
clientes puderam se classificados em um dos períodos do mês. A grande
maioria dos clientes não concentra suas compras em algumas das quinzenas.
Tabela 30 Estatísticas descritivas e percentis do número de compras
conforme a segmentação por quinzena.
dia 14 a 28
dia 29 a 13
Sem quinzena
Percentis (%)
dia 14 a 28
dia 29 a 13
Sem quinzena
N 2.072 4.532 25.972 5 12,00 12,00 12,00
Mínimo 12 12 12 10 12,00 12,00 14,00
Máximo 109 128 310 25 13,00 14,00 17,00
Soma 40.926 97.067 815.265 50 17,00 18,00 25,00
Média 19,75 21,42 31,39 75 22,75 25,00 39,00
Desvio Padrão 9,52 11,22 20,68 90 32,00 35,00 57,00
Assimetria 2,78 2,57 2,47 95 39,00 44,35 70,00
Erro Padrão ,0538 ,0364 ,0152
Curtose 13,07 10,35 11,19
Erro Padrão ,1075 ,0727 ,0304
Apesar de fazerem menos compras, os consumidores que pertencem a uma
das duas quinzenas as realizam com valor médio maior. Isto deve acontecer
pois, como eles vão menos freqüentemente às lojas, suas compras devem ser
suficientes para abastecê-los por um período maior de dias. A Tabela 31
mostra as estatísticas descritivas e os percentis do valor médio das compras
conforme a segmentação por quinzena.
125
Tabela 31 Estatísticas descritivas e percentis do valor médio das
compras conforme a segmentação por quinzena.
dia 14
a 28
dia 29
a 13
Sem
quinzena
Percentis
(%)
dia 14
a 28
dia 29
a 13
Sem
quinzena
N 2.072 4.532 25.972 5 33,64 34,65 30,57
Mínimo 13,63 8,36 8,13 10 43,41 46,27 39,57
Máximo 1.729,91 2.542,37 5.791,42 25 66,26 69,76 59,48
Média 127,49 127,27 109,01 50 105,97 105,29 91,29
Desvio Padrão 95,75 95,47 85,40 75 159,77 160,19 136,99
Assimetria 4,14 5,78 14,61 90 238,35 226,34 194,54
Erro Padrão ,0538 ,0364 ,0152 95 293,17 284,17 238,57
Curtose 45,39 101,57 793,71
Erro Padrão ,1075 ,0727 ,0304
Mesmo tendo um valor médio de compras maior, os clientes que concentram
suas compras gastam menos por mês. Os clientes classificados como “Sem
quinzena” gastaram em média R$3.140,00 ao longo do ano 2000. Em
compensação, os clientes que preferem a quinzena entre os dias 14 e 28
gastaram R$2.419,00 e os da outra quinzena R$2.530,00. Comparando as
duas quinzenas, os clientes do início do mês são melhores que os do meio do
mês. A Tabela 32 exibe as estatísticas descritivas e os percentis do valor total
das compras conforme a segmentação por quinzena.
A conclusão que pode ser tirada em função do comportamento dos clientes
ao longo das quinzenas é que o melhor consumidor é aquele que vai sempre
na loja, independentemente do período do mês. Este cliente não concentra
suas compras em período algum, e por isso está sempre comprando na rede
de varejo.
126
Tabela 32 Estatísticas descritivas e percentis do valor total das
compras conforme a segmentação por quinzena.
dia 14
a 28
dia 29
a 13
Sem
quinzena
Percentis
(%)
dia 14
a 28
dia 29
a 13
Sem
quinzena
N 2.072 4.532 25.972 5 534,83 611,33 671,50
Mínimo 186,50 127,00 136,00 10 733,15 824,80 905,15
Máximo 65.736 76.271 78.693 25 1.165,38 1.343,50 1.472,00
Soma 5.014.215 11.469.096 81.558.156 50 1.916,50 2.117,00 2.469,00
Média 2.419 2.530 3.140 75 3.096,38 3.176,88 3.982,50
Desvio Padrão 2.260 2.143 2.799 90 4.572,15 4.552,90 6.014,20
Assimetria 11,67 11,23 5,63 95 5.844,25 5.678,85 7.607,85
Erro Padrão ,0538 ,0364 ,0152
Curtose 299,64 325,25 80,37
Erro Padrão ,1075 ,0727 ,0304
Média do número de compras x
Segmentação por quinzena
Segmentação por quinzena
Sem quinzenadi a 29 a 13di a 14 a 28
Méd
ia d
o n
úm
ero
de
co
mpra
s
35
30
25
20
15
10
5
0
Valor médio das compras x
Segmentação por quinzena
Segmentação por quinzena
Sem quinzenadi a 29 a 13di a 14 a 28
Valo
r m
édio
das
com
pra
s
150
120
90
60
30
0
Valor total das compras x
Segmentação por quinzena
Segmentação quinzena
Sem quinzenadi a 29 a 13di a 14 a 28
Valo
r to
tal
da
s c
om
pra
s
3.500
3.000
2.500
2.000
1.500
1.000
500
0
Gráfico 41 Gráfico de barras do número, média e valor total de compras
conforme a segmentação por quinzena.
127
IV.2.3. Segmentação por número de dias da semana
Este segundo critério tem por objetivo verificar se é possível segmentar os
clientes através da quantidade de dias da semana em que preferem fazer
compras. Se o consumidor realizou 50% ou mais dos seus gastos em um dia
específico da semana, ele foi classificado como „Um dia‟. Se ele fez menos de
50% das compras em somente um dia, mas concentrou 80% ou mais de seus
gastos em dois determinados dias da semana, ele foi classificado como „Dois
dias‟. E se ele não obedeceu nenhum destes critérios ele foi classificado como
„Sem dia‟. Espera-se que os clientes que concentram suas compras em um ou
dois dias da semana sejam muito fiéis à loja e que suas compras não tenham
valores médios tão baixos.
Conforme pode ser visto na Tabela 33 e no Gráfico 42, os clientes que
fizeram suas compras em um ou dois dias são menos freqüentes e realizaram
menos compras em média. Isto pode ser confirmado tanto através da média
como dos percentis. Enquanto que os clientes classificados como “Sem dia”
realizaram em média 30 compras na rede, os clientes “Um dia” fizeram 24,67 e
os clientes “Dois dias” 22,16. Como havia acontecido com a segmentação
anterior, somente uma pequena parcela de todos os compradores (19%) foi
classificada como clientes de um ou dois dias.
Tabela 33 Estatísticas descritivas e percentis do número de compras
conforme a segmentação por número de dias da semana.
Sem dia Um dia Dois dias Percentis (%) Sem dia Um dia Dois dias
N 26.246 5.815 515 5 12 12 12
Mínimo 12 12 12 10 13 12 12
Máximo 310 124 89 25 16 14 14
Soma 798.371 143.473 11.414 50 24 20 18
Média 30,42 24,67 22,16 75 37 30 26
Desvio Padrão 20,48 14,26 12,00 90 55 46 38
Assimetria 2,59 1,81 2,10 95 69 54 47
Erro Padrão ,0151 ,0321 ,1076
Curtose 12,00 4,02 5,52
Erro Padrão ,0302 ,0642 ,2148
128
Mesmo realizando menos compras, o valor médio dos clientes que
concentram suas compras em somente um ou dois dias da semana é
consideravelmente maior quer o dos outros clientes. A médias dos cientes que
concentram suas compras em somente um dia da semana é R$129,16 contra
R$108,78 dos clientes não classificados. Esta diferença corresponde a 18,74%
do valor médio dos compradores „Sem dia‟ (Tabela 34 e Gráfico 42).
Tabela 34 Estatísticas descritivas e percentis do valor médio das
compras conforme a segmentação por número de dias da
semana.
Sem dia Um dia Dois dias Percentis (%) Sem dia Um dia Dois dias
N 26.246 5.815 515 5 30,23 36,81 37,99
Mínimo 8,13 8,36 8,86 10 39,38 47,01 50,57
Máximo 5.791,42 1.126,37 567,63 25 58,92 72,24 71,98
Média 108,78 129,16 128,25 50 90,52 110,28 108,64
Desvio Padrão 87,33 88,84 80,58 75 136,25 160,80 169,42
Assimetria 14,57 2,97 1,68 90 194,76 225,72 230,15
Erro Padrão ,0151 ,0321 ,1076 95 241,75 282,54 286,95
Curtose 745,23 18,28 4,13
Erro Padrão ,0302 ,0642 ,2148
Em função deste maior valor médio de compras, os clientes que preferem
realizar suas compras em somente um dia da semana possuem um valor total
médio de compras maior: R$3.087,01 e R$2.996,64 respectivamente (Tabela
35 e Gráfico 42). Apesar de pequena, esta superioridade é comprovada
estatisticamente através da comparação de médias pelo teste-t entre amostras
independentes com um intervalo de confiança igual a 95%. A hipótese de
igualdade entre as médias é rejeitada pois o valor da estatística t é de –2,26,
com 8.394 graus de liberdade (não assumindo a igualdade de variâncias),
resultando numa significância bi-caudal de 0,024.
129
Tabela 35 Estatísticas descritivas e percentis do valor total das
compras conforme a segmentação por número de dias da
semana.
Sem dia Um dia Dois dias Percentis (%) Sem dia Um dia Dois dias
N 26.246 5.815 515 5 651,67 628,50 617,60
Mínimo 127,00 146,50 273,50 10 888,00 853,50 868,40
Máximo 78.693 49.158 24.923 25 1.428,00 1.416,00 1.290,50
Soma 78.649.693 17.950.946 1.440.827 50 2.376,00 2.366,50 2.161,50
Média 2.996 3.087 2.797 75 3.797,00 3.885,00 3.472,00
Desvio Padrão 2.685 2.776 2.398 90 5.663,95 6.000,20 5.330,80
Assimetria 6,83 4,20 3,12 95 7.191,15 7.736,00 8.247,00
Erro Padrão ,0151 ,0321 ,1076
Curtose 118,97 37,52 17,61
Erro Padrão ,0302 ,0642 ,2148
Média do número de compras x
Segmentação por número de dias da semana
Segmentação por número de dias da semana
Dois diasUm diaSem dia
Méd
ia d
o n
úm
ero
de
co
mpra
s
35
30
25
20
15
10
5
0
Valor médio das compras x
Segmentação por número de dias da semana
Segmentação por número de dias da semana
Dois diasUm diaSem dia
Valo
r m
édio
das
com
pra
s
150
120
90
60
30
0
Valor total das compras x
Segmentação número de dias da semana
Segmentação por número de dias da semana
Dois diasUm diaSem dia da semana
Valo
r to
tal
da
s c
om
pra
s
3.500
3.000
2.500
2.000
1.500
1.000
500
0
Gráfico 42 Gráfico de barras do número, média e valor total de compras
conforme a segmentação por número de dias da semana.
130
A conclusão que pode ser tirada desta segmentação por número de dias da
semana em que concentram suas compras é que as pessoas que as fazem
compras em um determinado dia da semana realmente apresentam algumas
características bem atrativas para a empresa. Apesar de não serem os clientes
mais freqüentes, seu volume total de compras é maior que a média.
IV.2.4. Segmentação por loja
A última segmentação que foi feita é a separação dos clientes por lojas. Se
uma pessoa teve uma freqüência em uma determinada loja maior ou igual a
80% do número total suas de compras ela foi classificada como cliente desta
loja.
Tabela 36 Estatísticas descritivas do número de compras conforme a
segmentação por loja.
Sem loja Loja 1 Loja 2 Loja 3 Loja 4
N 891 12.276 13.689 4.506 1.214
Mínimo 12 12 12 12 12
Máximo 197 310 239 227 216
Soma 20.878 389.785 406.430 105.299 30.866
Média 23,43 31,75 29,69 23,37 25,43
Desvio Padrão 16,01 20,93 19,78 13,85 16,83
Assimetria 4,45 2,58 2,37 3,06 3,48
Erro Padrão ,0819 ,0221 ,0209 ,0365 ,0702
Curtose 32,23 13,00 9,06 19,80 22,17
Erro Padrão ,1637 ,0442 ,0419 ,0729 ,1403
131
Tabela 37 Percentis do número de compras conforme a segmentação
por loja.
Percentis (%) Sem loja Loja 1 Loja 2 Loja 3 Loja 4
5 12,00 13,00 12,00 12,00 12,00
10 13,00 14,00 13,00 12,00 13,00
25 14,00 17,00 16,00 14,00 15,00
50 19,00 25,00 23,00 19,00 20,00
75 27,00 39,00 37,00 27,00 30,00
90 37,00 57,00 54,00 41,00 44,00
95 50,00 71,00 67,50 51,00 56,00
A Tabela 36 mostra as estatísticas descritivas do número de compras
conforme a segmentação por loja e o Gráfico 43 exibe o gráfico de barras do
número, média e valor total de compras conforme a segmentação por loja. Ao
contrário dos outros critérios de segmentação, apenas 3% não foram
classificados segundo este critério. Os clientes das lojas 1 e 2 são os mais
freqüentes, sendo que os primeiros são um pouco mais. Apesar de pequena,
esta superioridade é comprovada estatisticamente através do comparação de
médias pelo teste-t entre amostras independentes, o valor da estatística t é de
8,13, com 25.271 graus de liberdade (não assumindo a igualdade de
variâncias), resultando numa significância bi-caudal de 0,000. Através da
análise de percentis exibida na Tabela 39 é possível confirmar a maior
freqüência dos clientes da loja 1 e da loja 2. Enquanto que 25% dos clientes da
loja 1 fizeram 39 compras ou mais durante o ano, na loja 3 apenas 10% dos
clientes fizeram 41 compras ou mais.
132
Tabela 38 Estatísticas descritivas do valor médio das compras
conforme a segmentação por loja.
Sem loja Loja 1 Loja 2 Loja 3 Loja 4
N 891 12.276 13.689 4.506 1.214
Mínimo 15,21 8,20 8,13 8,44 13,34
Máximo 2.185,73 5.791,42 2.542,37 799,28 970,73
Soma 116.119 1.255.564 1.639.307 520.641 140.547
Média 130,32 102,28 119,75 115,54 115,77
Desvio Padrão 144,80 85,45 88,51 75,45 81,13
Assimetria 7,62 25,61 4,66 2,04 2,74
Erro Padrão ,0819 ,0221 ,0209 ,0365 ,0702
Curtose 84,71 1.609,55 69,22 8,10 15,60
Erro Padrão ,1637 ,0442 ,0419 ,0729 ,1403
Tabela 39 Percentis do valor médio das compras conforme a
segmentação por loja.
Percentis (%) Sem loja Loja 1 Loja 2 Loja 3 Loja 4
5 31,98 29,72 32,31 32,12 34,62
10 41,12 38,17 42,56 42,09 43,39
25 64,74 56,83 64,39 63,70 61,91
50 101,66 86,68 100,18 97,81 93,20
75 150,79 129,09 150,19 147,74 146,33
90 224,41 181,31 215,96 207,71 216,35
95 299,95 219,22 269,06 255,66 258,86
Passando a analisar o valor médio por compra, os clientes da loja 1 já não
apresentam um bom desempenho. Através das estatísticas descritivas exibidas
na Tabela 38 pode-se verificar que a sua média (R$102, 28) é a menor de
todas, correspondendo a 85% da média dos clientes da loja 2 (R$119,75), a
maior de todas. Comparando os percentis exibidos na Tabela 39 é possível
comprovar a maior média dos clientes da loja 2, onde 25% dos clientes têm um
valor médio por compra acima de R$150,00.
133
Tabela 40 Estatísticas descritivas do valor total das compras conforme
a segmentação por loja.
Sem loja Loja 1 Loja 2 Loja 3 Loja 4
N 891 12.276 13.689 4.506 1.214
Mínimo 182,50 150,50 127,00 136,00 174,00
Máximo 62.376 69.497 78.693 41.562 22.908
Soma 2.639.466 35.728.308 44.924.545 11.454.100 3.295.047
Média 2.962 2.910 3.281 2.541 2.714
Desvio Padrão 4.285 2.284 3.048 2.157 2.276
Assimetria 7,69 5,04 6,24 5,06 3,06
Erro Padrão ,0819 ,0221 ,0209 ,0365 ,0702
Curtose 79,52 86,45 96,86 56,52 15,27
Erro Padrão ,1637 ,0442 ,0419 ,0729 ,1403
Tabela 41 Percentis do valor total das compras conforme a
segmentação por loja.
Percentis (%) Sem loja Loja 1 Loja 2 Loja 3 Loja 4
5 605,30 676,93 656,00 580,67 684,63
10 808,50 907,00 905,00 780,35 911,75
25 1.211,50 1.454,13 1.490,75 1.261,75 1.305,13
50 2.021,50 2.380,75 2.539,00 2.043,75 2.089,00
75 3.324,50 3.761,38 4.166,00 3.168,00 3.327,50
90 5.244,40 5.445,60 6.328,00 4.718,20 5.167,25
95 7.621,00 6.836,37 8.079,00 6.137,40 6.797,88
Como era de se esperar, os clientes da loja 2 são os que apresentam a
maior média de compras ao longo do ano 2000. Analisando as estatísticas
descritivas exibidas na Tabela 40 é possível observar que a média dos gastos
destes clientes foi de R$3.281,00. Mesmo não tendo uma grande média por
compra, os clientes da loja 1 apresentam a segunda maior média de consumo
durante o ano graças à sua freqüência à loja: R$2.910.00. Observando os
percentis mostrados na Tabela 41, é possível perceber que na loja 2, dez por
cento dos clientes gastaram mais de R$6.300,00 durante o ano, que
corresponde a mais de R$525,00 por ano. Em compensação, analisando os
desvios padrão, pode-se constatar que os clientes da loja 1 são mais
134
homogêneos. Enquanto que o seu desvio padrão é de R$2.284,00, o dos
clientes da loja 2 é de R$3.084,00.
Média do número de compras x
Segmentação por loja
Segmentação por loja
Loja 4Loja 3Loja 2Loja 1Sem loj a
Méd
ia d
o n
úm
ero
de
co
mpra
s
35
30
25
20
15
10
5
0
Valor médio das compras x
Segmentação por loja
Segmentação por loja
Loja 4Loja 3Loja 2Loja 1Sem loj a
Valo
r m
édio
das
com
pra
s
150
120
90
60
30
0
Valor total das compras x
Segmentação por loja
Segmentação por loja
Loja 4Loja 3Loja 2Loja 1Sem loj a
Valo
r to
tal
da
s c
om
pra
s
3.500
3.000
2.500
2.000
1.500
1.000
500
0
Gráfico 43 Gráfico de barras do número, média e valor total de compras
conforme a segmentação por loja.
Estes resultados confirmam as conclusões tiradas na análise das compras
por loja: os clientes da loja 1 são mais freqüentes e consomem menos por
compra. Por outro lado, os clientes da loja 2 são os que mais gastam em suas
compras. Mas será que a empresa não precisa de maiores gastos em
propaganda para manter os clientes da loja 2 do que os da loja 1? Cabe à
empresa fazer este estudo e responder esta pergunta.
135
CAPÍTULO V CONCLUSÃO
V.1. A IMPORTÂNCIA DO CRM
Neste trabalho, tentou-se mostrar a importância do CRM e como a utilização
de técnicas quantitativas pode ajudar muito na construção do relacionamento
entre empresas e clientes. Para mostrar a importância que o CRM está tendo
no mundo atual, foi feita uma revisão da literatura onde diversos autores
concordam que a criação de um relacionamento de longo prazo com seus
clientes pode ser o caminho para muitas empresas frente ao aumento da
concorrência. Também foi possível constatar que a tecnologia, hoje em dia,
está tornando cada vez mais viável este relacionamento possibilitando a
customização da comunicação e da produção em massa. Estes fatos, entre
outros, vem despertando a curiosidade do meio acadêmico e empresarial para
o CRM.
Entre os diversos benefícios do CRM, a principal vantagem é a fidelização
dos clientes. Através da repetição de compras bem sucedidas, onde suas
expectativas foram atingidas ou superadas, o cliente vai se tornando mais fiel a
uma empresa e mais inacessível a seus concorrentes. Deste modo, a
organização não precisa fazer pesados investimentos em propaganda para
manter ou buscar novos clientes. Além disso, quando o faz, sua comunicação é
muito mais direta e eficiente. Contudo, apesar da redução nos custos diretos de
manutenção e de aquisição de clientes, estar sempre atendendo os seus
desejos traz outras despesas para a empresa. Por isto, este relacionamento
não deve ser construído com todos os clientes, cabendo à organização calcular
quem são os mais valiosos. Para calcular o valor de um cliente, a empresa não
deve levar em conta somente o seu comportamento atual, pois há muitos casos
onde a mudança de perfil de um consumidor é esperada. As empresas devem
estar atentas a estes momentos, pois a mudança pode representar uma grande
oportunidade. Outro fato para o qual as firmas precisam estar atentas é que o
136
relacionamento não é construído de um dia para o outro, e nem é eterno. Elas
precisam estar continuamente criando valor para seus clientes segundo o
ponto de vista deles.
Um dos motivos que desperta tanta atenção para o CRM é que o conceito
de relacionamento, que embora não seja novo, parece difícil de ser
implementado num mundo dominado pela produção em massa e pela
preocupação com custos. Calcular o valor de um cliente e estar sempre criando
valor para eles não são tarefas triviais, pois dependem do comprometimento de
toda a firma e do tipo da indústria onde a empresa atua.
O primeiro passo para colocar o CRM em funcionamento é obter o máximo
de informações sobre os clientes. Somente assim, uma empresa saberá quem
são seus melhores clientes e como agradá-los. Neste contexto, os bancos de
dados, o data warehouse e o data mining são ferramentas muito úteis na
obtenção, armazenamento, manipulação e extração de conhecimento a partir
destes dados. Os bancos de dados e o data warehouse permitem que estas
informações sejam armazenadas de forma segura, que estejam sempre
atualizadas e que possam ser manipuladas de forma fácil. Já o data mining
viabiliza a extração de conhecimento a partir destes dados. O data mining
utiliza o avanço tecnológico para extrair o conhecimento de grandes bases de
dados, conseguindo informações que dificilmente poderiam ser obtidas por
outros métodos. Apesar de muitos autores afirmarem que o data mining é uma
ferramenta de fácil utilização, há controvérsias pois ele utiliza modelos
quantitativos bastante complexos. Diz-se que por utilizar modelos de
inteligência artificial o data mining não necessita qualquer interferência
humana, pois toda informação pode ser obtida exclusivamente pelo
computador. Contudo, isto não é totalmente verdade, pois estas informações
precisam sempre ser confrontadas com a realidade, não devendo ser
encaradas como verdade absoluta. Muitas vezes é necessário a interferência
humana para compatibilizar os modelos com a realidade e devido à
complexidade do data mining esta tarefa exige mão-de-obra muito
especializada. Mesmo assim, atualmente, já há vários exemplos de empresas
137
que conseguiram melhorar o relacionamento com os seus clientes através das
informações obtidas utilizando-se o data mining e o CRM.
Um exemplo de indústria onde o CRM pode causar uma revolução é o
varejo. Devido ao contato direto com os clientes e com o advento das compras
on line, a obtenção de informações sobre o seu comportamento de compra e a
criação de valor para eles deixaram de ser tarefas impossíveis. No Brasil
especificamente, devido ao grande grau de concorrência entre as principais
empresas, o CRM poderá ser ainda mais útil. É exatamente na indústria
varejista onde este trabalho mostra um exemplo de como é possível obter
conhecimento com a utilização de técnicas quantitativas simples.
V.2. RESULTADOS E CONCLUSÕES DA ANÁLISE DOS DADOS
Dada a competitividade atual do mercado varejista, uma empresa que
consiga extrair o máximo de informações sobre seus clientes e construir um
relacionamento de longo prazo com eles estará obtendo uma importante
vantagem competitiva. Através do exemplo de análise de dados de uma rede
varejista, esperou-se ilustrar uma pequena parte das informações que podem
ser obtidas. Através das informações obtidas a empresa poderia repensar
alguns de seus processos, seu posicionamento e sua estratégia, estreitando o
relacionamento com os seus clientes mais valiosos.
O primeiro estudo feito foi a análise de todas as compras. Ao contrário do
que era esperado, não foi possível estabelecer uma relação entre o valor da
compra e o número de dias desde que um cliente havia feito a sua última
compra. Esta relação não foi possível devido à grande variedade no perfil de
compra dos clientes. A primeira conclusão que pôde ser tirada é que devido à
heterogeneidade dos dados é muito difícil chegar a alguma conclusão
analisando todos os clientes ao mesmo tempo. Por este motivo, deve-se tentar
algum tipo de segmentação para que o padrão de compra de cada grupo de
consumidor fique mais claro.
138
Continuando a analisar as compras, o próximo estudo feito foi o seu
acompanhamento ao longo do ano. Como era esperado, dezembro se mostrou
como um mês de vendas fortes, entretanto, o mês de agosto superou-o no
número de compras. Como só foram analisados os dados do ano 2000, é
impossível concluir que o mês de agosto seja sempre um mês de vendas
fortes. Na verdade, é bem provável que o desempenho deste mês tenha sido
causado por um fator externo econômico, ou devido a alguma promoção. Cabe
à empresa tentar verificar o que causou este desempenho inesperado. Se a
causa tiver sido um fator econômico externo, a firma deve tentar descobrir qual
foi, e passar a ficar atenta pois quando ele se repetir é provável que o volume
de vendas volte a crescer novamente. Por outro lado, se a causa tiver sido a
realização de uma promoção, a firma deve ava liar se o aumento das vendas
realmente atingiu o esperado e se o resultado final foi compensador.
Ainda analisando a evolução das compras ao longo do tempo, foi possível
detectar dois padrões sazonais no comportamento dos clientes: o semanal e o
mensal. Ao contrário do que poderia ser esperado, o padrão semanal foi mais
forte que o mensal. Este pode ser um reflexo da estabilidade monetária
brasileira, pois em épocas de inflação mais alta é provável que a sazonalidade
mensal fosse mais forte. Estudando o comportamento das compras ao longo
do mês a única diferença que pôde ser notada foi um pequeno aumento no
valor médio das compras no início do mês. A quantidade de compras
permanece praticamente a mesma, mostrando que os clientes não escolhem
somente o início do mês para fazerem suas compras. Em relação a
sazonalidade semanal, uma grande diferença foi encontrada entre os finais de
semana e os outros dias da semana. Como era de se esperar, a compras nos
finais de semana são mais heterogêneas. Sábado é o dia com maior receita
total de compras. Domingo possui a menor. É possível notar que muitos
clientes fazem suas compras nos finais de semana não podem fazê-las nos
outros dias, e por isso escolhem principalmente o sábado. Por outro lado,
analisando os dias de segunda a sexta-feira, percebe-se exatamente o
contrário: os clientes que podem fazer suas compras nestes dias não têm um
dia fixo de preferência, mas evitam os finais de semana. A exceção fica para a
139
terça-feira, pois devido a uma promoção na seção de verduras e legumes,
muitos clientes preferem fazer compras neste dia.
Devido à forte sazonalidade semanal, muitas sugestões podem ser dadas
para explorar este fato:
a. Como domingo é o dia com menores vendas, a empresa deve discutir se
realmente vale a pena abrir as lojas neste dia. Entretanto, mesmo que
financeiramente não seja compensador, a empresa não deve esquecer a
questão da imagem da rede que deixaria de ter suas lojas “abertas todos
os dias da semana” e deixaria de ser uma loja de conveniência;
b. Decidindo manter as lojas abertas aos domingos, a empresa poderia
avaliar a criação de incentivos para algumas pessoas trocarem o sábado
pelo domingo. Assim, a ociosidade aos domingos seria reduzida e a
empresa poderia prestar um serviço melhor aos sábados, quando
atualmente as lojas estão mais cheias;
c. Devido à resposta à promoção nas terças-feiras, a empresa deve avaliar
se este resultado é compensador. Seria interessante estudar qual seria o
impacto se esta promoção acabasse ou se ela fosse estendia a mais um
ou dois dias da semana, por exemplo;
d. Como foi possível perceber uma diferença de padrão de compras
conforme os dias da semana, a empresa poderia avaliar se outros tipos
de promoções, conforme as características das compras de cada dia,
não poderiam ser lucrativas. Por exemplo, na segunda-feira as compras
são mais homogêneas e os clientes mais constantes, será que uma
promoção que premiasse estas características não atrairia ainda mais
clientes neste dia e aumentaria a fidelidade dos atuais?
A última análise feita com as compras foi separando-as por loja. Foi possível
perceber que a diferença de receita e do perfil dos clientes entre as lojas era
grande. Para confirmar a existência destas diferenças, no final do estudo, fez-
se a segmentação dos clientes conforme as lojas.
140
Depois de analisar as compras, passou-se a estudar os clientes. A primeira
conclusão que pôde ser tirada foi a confirmação de que apenas uma pequena
parte dos clientes é responsável pela maioria das compras e da receita. Por
este motivo, a empresa deve tentar achar um meio de identificar estes clientes
pois eles são os mais valiosos e merecem a construção de um relacionamento
de longo prazo.
A primeira tentativa de segmentação foi através do período do mês em que
os clientes fazem compras. Entretanto, esta segmentação não trouxe
resultados significativos devido a dificuldade de classificação dos clientes.
Como os clientes atualmente comparecem durante todo o mês, é difícil separá-
los segundo este critério.
O segundo critério foi o número de dias da semana em que eles preferem
fazer suas compras. Era esperado que os clientes mais fiéis tivessem um ou
dois dias de preferência. Novamente este critério não apresentou resultados
muito bons pois poucos clientes foram classificados.
O último critério foi a separação por loja de preferência. Esta foi a
segmentação que apresentou os melhores resultados. Os clientes da loja 1 se
destacaram como os mais freqüentes apesar de terem um valor médio das
compras menor. Já os da loja 2 são os que possuem o maior valor médio por
compra. Em função destes resultados a empresa deveria estudar a viabilidade
e a lucratividade de cada loja. Será que todas as quatro são lucrativas e devem
ser mantidas? Outro questionamento que a empresa deve fazer é: será que
esta diferença de resultados se deve exclusivamente à diferenças no perfil
populacional de cada região a que cada loja atende? É bem provável que
essas diferenças não possam ser justificadas exclusivamente por fatores
externos à empresa. A imagem e o posicionamento das lojas em suas regiões
podem ser diferentes e estas são variáveis que podem ser trabalhadas pelo
marketing. Mesmo que a conclusão seja que a localização e as características
da região são fatores importantíssimos, cabe a firma descobrir quais são os
fatores que caracterizam uma boa região para que as novas lojas sejam
construídas em locais onde estes resultados possam ser repetidos.
141
Analisando todas estas informações obtidas, foi possível mostrar que com a
utilização de métodos quantitativos simples muito conhecimento pode ser
extraído. Cabe à empresa, de posse de todo este conhecimento, reunir seus
departamentos de marketing, finanças e operações para reavaliar a sua
estratégia. O departamento de marketing deve analisar se as promoções
realmente estão de acordo com o perfil dos clientes. Deve verificar também se
este tipo de cliente era realmente o alvo da empresa e pensar em novas
promoções para criar ou manter a sua fidelidade. O departamento de finanças
deveria analisar se o resultado das promoções realizadas realmente foi
satisfatório. Em conjunto com o departamento de marketing, ele também
deveria estudar se a política de vendas a prazo e concessão de crédito está de
acordo com o perfil de cliente encontrado. Já o departamento de operações
deveria verificar se o abastecimento da loja e o atendimento aos clientes estão
sendo planejados levando em consideração o padrão de compras apresentado
pelos clientes.
Se a firma for capaz de utilizar eficientemente todo este conhecimento, ela
estará dando um grande passo rumo à vitória neste mundo tão competitivo.
V.3. SUGESTÃO PARA ESTUDOS FUTUROS
Como este trabalho se limitou a exemplificar apenas alguns métodos
quantitativos, há diversas sugestões de estudos que podem ser feitos no futuro
por esta empresa. Há sugestões que vão desde simples aprofundamento do
que já foi feito, até outras que envolvem a utilização de ferramentas
quantitativas e bancos de dados mais complexos:
a. Segmentar os clientes por dia da semana – Já que a segmentação por
número de dias na semana não trouxe o resultado esperado (mas está
claro que os dias da semana têm diferentes perfis de compras) deve-se
continuar tentando algum tipo de segmentação que utilize esta
informação. Também poder-se-ia tentar diferenciar os clientes como
“clientes de finais de semana” ou “clientes de segunda a sexta-feira”;
142
b. Utilizar técnicas mais avançadas de data mining – Para ajudar na
segmentação dos clientes poder-se-ia utilizar ferramentas quantitativas
mais complexas como análise de clusters e redes neurais. Estas
ferramentas podem ajudar ainda mais na tarefa de identificação do perfil
de compra dos clientes mais valiosos;
c. Combinar a utilização das variáveis RFM para classificar os clientes –
Seguindo exemplos já citados na literatura, poder-se-ia tentar segmentar
os clientes em função das variáveis RFM (recency, frequency e
monetary);
d. Criar um alarme de freqüência – Além de se preocupar em identificar
quem são os seus clientes principais, seria interessante criar um
mecanismo que ajude a identificar quando estes clientes estão mudando
o seu comportamento, indicando que possam estar abandonando a
empresa. Uti lizando ferramentas quantitativas, pode ser possível a
criação deste alarme que ajude a identificar quando um cliente
importante para a empresa está mudando (diminuindo) o seu padrão de
freqüência às lojas;
e. Expandir a janela do banco de dados armazenando dados por um
período maior do que um ano – Conforme o banco de dados se tornar
maior, possuindo dados mais antigos, informações como a evolução do
número de dias entre compras ao longo do ano e a descoberta de
sazonalidades dentro do ano poderiam ser obtidas;
f. Expandir o banco de dados com informações sobre a cesta de compras
de cada cliente – Através desta expansão seria possível estudar qual o
tipo de compra padrão dos clientes mais valiosos, além de identificar
produtos que normalmente são comprados em conjunto;
g. Aprofundar a análise dos clientes mais importantes – Dado que foi
possível mostra através do gráfico de Pareto que realmente existe um
grupo de clientes especial, a empresa deve tentar conhecê-los mais
detalhadamente. Para isto, ela poderia utilizar além dos dados das
143
compras (valores e cesta), os seus dados sócio-econômicos. Analisando
todas estas informações, ficaria mais fácil descobri quem são estes
clientes.
Como se pode perceber o limite para obtenção de novas informações é
praticamente infinito. Cabe à empresa saber utilizar este conhecimento e
avaliar até quando o esforço e os gastos compensam.
144
REFERÊNCIAS BIBLIOGRÁFICAS
ALBERTIN, A.L.; MARQUES, E.V. Os aspectos e contribuições do comércio
eletrônico para o setor de varejo. In: ENCONTRO ANUAL DA ANPAD -
ENANPAD, 23, 1999, Foz do Iguaçu. Anais eletrônicos... São Paulo:
EAESP/FGV, 1999. 1 CD.
ANDERSON, E.W.; FORNELL, C.; LEHMANN, D.R. Customer satisfaction,
market share, and profitability: findings from Sweden. Journal of Marketing,
Chicago, v. 58, n. 3, p. 53-66, jul. 1994.
ANDERSON, J.C.; NAURUS, J.A. Business marketing: understanding what
customers value. Harvard Business Review, Boston, v. 76, n. 6, p. 53-65,
nov./dec. 1998.
APICELLA, M. Customer relationship management: ramping up sales service.
InfoWorld, Framingham, v. 21, n. 33, p. 68-80, 16 aug. 1999.
BERSON, A.; SMITH, S.; THEARLING, K. Building data mining applications
for CRM. New York: McGraw-Hill, 1999. 510p.
BUTTLE, F. The CRM value chain. Disponível em: <http://www.crm-
forum.com>. Acesso em 08 jan. 2001.
COOPER, B.L.; WATSON, H.J.; WIXON, B.H.; GOODHUE, D.L. Data
warehousing supports corporate strategy at First American Corporation. MIS
Quarterly, (Minneapolis), v. 24, n. 4, p. 547-567, dec. 2000.
CROSS, R.; SMITH, J. Retai lers move toward new customer relationships.
Direct Marketing, New York, v.57, n.8, p. 20-22, dec. 1994.
DATA DISTILLERIES. Introdução à mineração de dados – descobrindo valor
escondido nas suas bases de dados. Disponível em:
<http://www.marketingdeprecisao.com.br>. Acesso em 11 jan. 2001.
145
DAVIDS, M. How to avoid the 10 biggest mistakes in CRM. Journal of
Business Strategy, Boston, v. 20, n. 6, p. 22-26, nov. 1999.
EVANS, P.B.; WURSTER, T.S. Strategy and the new economics of information.
Harvard Business Review, Boston, v. 75, n. 5, p. 71-82, sept./oct. 1997.
FELDENS, M.; REATEGUI, E. Roadmaps para projetos de marketing de
precisão. Disponível em: <http://www.marketingdeprecisao.com.br>. Acesso
em 11 jan. 2001.
FOURNIER, S.; DOBSCHA, S.; MICK, D.G. Preventing the premature death of
relationship marketing. Harvard Business Review, Boston, v. 76, n. 1, p. 42-
51, jan./feb. 1998.
HA, S.H.; PARK, S.C. Application of data mining tools to hotel data mart on the
internet for database marketing. Expert Systems with Applications,
Amsterdam, v. 15, n. 1, p. 1-31, jul. 1998.
HIRATA, C. O cliente é quem manda. SuperHiper, São Paulo, v.26, n.300, p.
10-20, ago. 2000.
HUGHES, A.M. Boosting response with RFM – recency, frequency, and
monetary analysis finds the buyers in your database. American
Demographics, Ithaca, p. 4-10, may 1996.
HUI, S.C.; JHA, G. Data mining for customer service support. Information &
Management, Oxford, v. 38, n. 1, p. 1-13, oct. 2000.
JACKSON, B.B. Build customer relationships that last. Harvard Business
Review, Boston, v. 63, n. 6, p. 120-128, nov./dec. 1985.
JACKSON, R.R.; WANG, P. Strategic database marketing. Lincolnwood: NTC
Business Books, 1994. 262p.
KELLY, T.H. Maximizing lifetime customer value. LIMRA’s MarketFacts,
Hartford, v. 19, n. 6, p. 30-36, nov./dec. 2000.
146
KISH, J. Before your customers leave... Bank Marketing, Washington, v. 32, n.
12, p. 30-35, dec. 2000.
KNOX, S. Loyalty-based segmentation and the customer development process.
European Management Journal, Oxford, v. 16, n. 6, p. 729-737, dec. 1998.
NEWELL, F. Fidelidade.com. São Paulo: Makron Books, 2000. 285p.
PAES, A.M.M. Programas de lealdade em montadoras: um estudo na
indústria automobilística brasileira. Rio de Janeiro: UFRJ/COPPEAD, 1999.
136p. Dissertação. (Mestrado em Administração)
PEPPARD, J. Customer relationship managemet (CRM) in financial services.
European Management Journal, Oxford, v. 19, n. 3, p. 312-327, jun. 2000.
PEPPERS, D.; ROGERS, M.; DORF, B. Is your company ready for one-to-one
marketing? Harvard Business Review, Boston, v. 77, n. 1, p. 151-160,
jan./feb. 1999.
PESSANHA FILHO, R.C.; FERREIRA, A.L.; CORREA, S.C.H. Clube de
clientes: no marketing de relacionamento “o essencial é invisível para os olhos”.
In: ENCONTRO ANUAL DA ANPAD - ENANPAD, 24, 2000, Florianópolis.
Anais eletrônicos... Rio de Janeiro: COPPEAD/UFRJ, 2000. 1 CD.
PINE II, B.J.; PEPPERS, D.; ROGERS, M. Do you want to keep your customers
forever? Harvard Business Review, Boston, v. 73, n. 2, p. 103-114, mar./apr.
1995.
PINE II, B.J.; VICTOR, B.; BOYNTON, A.C. Making mass customization work.
Harvard Business Review, Boston, v. 71, n. 5, p. 108-119, sept./oct. 1993.
QUBE CONSULTING. Predicting and using customer lifetime value to
improve profitability. Disponível em: <http://www.crm-forum.com>. Acesso em
11 jan. 2001.
147
SAARENVIRTA, G. Data mining to improve profitability. CMA, Hamilton, v. 72,
n. 2, p. 8-12, mar. 1998.
SANTOS, O.G. Avaliação de bases de segmentação de mercados: um
estudo do mercado de automóveis de passeio da cidade do Rio de Janeiro. Rio
de Janeiro: UFRJ/COPPEAD, 1978. 88p. Dissertação. (Mestrado em
Administração)
SAUNDERS, C.; MERTZER, M. Driving customer retention, development
and acquisition for profit in the insurance business. Disponível em:
<http://www.crm-forum.com>. Acesso em 08 jan. 2001.
SFORNA, M. Data mining in a power company customer database. Electric
Power Systems Research, Texas, v. 55, n. 3, p. 201-209, sept. 2000.
STONE, M.; WOODCOCK, N.; WILSON, M. Managing the change from
marketing planning to customer relationship management. Long Range
Planning, Exeter, v. 29, n. 5, p. .675-683, oct. 1996.
SUPERHIPER. São Paulo: Abras, v. 26, n. 297, mai. 2000.
SWEAT, J. Are customers kings? InformationWeek, Manhasset, Issue 816, p.
42-54, 11 dec. 2000.
TAURION, C. Apanhado geral de data mining. Disponível em:
<http://www.marketingdeprecisao.com.br>. Acesso em 11 jan. 2001a.
TAURION, C. Implementando CRM com sucesso: algumas recomendações.
Disponível em: < http://www.marketingdeprecisao.com.br/>. Acesso em 10 jan.
2001b.
VELLIDO, A.; LISBOA, P.J.G.; MEEHAN, K. Segmentation of the on-line
shopping marketing using neural networks. Expert Systems with
Applications, Amsterdam, v. 17, n. 4, p. 303-314, nov. 1999.
148
VERGARA, S.C. Projetos e relatórios de pesquisa em administração. São
Paulo: Atlas, 1997. 90p.
Recommended