Em 2019, o faturamento do comércio eletrônico no Brasil foi de R$ 75 bilhões de reais, uma alta de 22,7%, em relação ao ano anterior, de acordo com o estudo da NeoTrust. Esse estudo, utilizou os dados de compras da empresa Olist, plataforma de varejo online, com o objetivo de verificar a relevância dos dados geográficos na segmentação de clientes.
Aplicando técnicas de clusterização que nos permita a gestão de clientes de maneira estratégia, permitindo o direcionamento de campanhas de marketing.
Na análise exploratória, foi evidenciado geograficamente que o Estado de São Paulo possuía a maior concentração dos pedidos, por isso a modelagem teve foco na capital do estado. O período analisado foi de 2016 a 2018 com um total de 18 mil pedidos de compras. As ferramentas utilizadas foram: JupyterLab, Python3, Tableau e QGIS (Open Source Geographic Information System).
Com essa metodologia, foi possível para o suposto departamento de marketing, as seguintes ações: ter grupos de clusters como clientes VIP e Insiders segmentando a atuação. O direcionamento para as campanhas com foco nas categorias de "Beleza e Saúde" e "Cama Mesa e Banho". Além, da possibilidade financeira de criar promoções de frete grátis na zona sul da capital de São Paulo.
O Banco Central (BC) fez um levantamento de dados e divulgou em 2019 a "Estatística de Pagamentos de Varejo e Cartões no Brasil", que constatou que existiam 123 milhões de cartões de créditos ativos no país, e os gastos chegaram a R$ 1,089 trilhões em transações.
Dado a relevância do tema para o mercado, realizamos o estudo de caso utilizando um conjunto de dados disponibilizado publicamente no Kaggle. Não possui dados pessoais dos titulares dos cartões, o que existe é um campo com números sequenciais fictícios atribuídos como identificador único (ID). Entretanto, essa informação não é significante em nosso modelo, e por isso desconsideramos garantindo o anonimato das transações.
A manipulação, análise e visualização de dados foram desenvolvidas na linguagem R de programação estatística utilizando o R Studio. Como resultado identificamos 03 grupos de clientes com perfis comportamentais distintos. São eles: o primeiro são titulares que gastam mais e tendem a parcelar, o segundo utilizam o cartão principalmente para o serviço de adiantamento em dinheiro e por último titulares com maior poder de compra e valores de gastos expressivos.
Diversos mecanismos tecnológicos surgem diariamente em nossas vidas, e um deles é o consumo de serviços em nuvem. Diante da nova realidade do home office, muitas empresas tiveram que adaptar seus negócios e começaram a usar essas novas ferramentas, ou até mesmo se já fazia o uso expandir o consumo.
Nesse estudo temos a análise do comportamento do consumo dos créditos em nuvem adquiridos pelos clientes ao longo do tempo. A previsão de uma série temporal é uma abordagem estatística ou de machine learning que usa os dados históricos para fazer previsões sobre determinados pontos de tempos futuros.
A manipulação, análise e modelo de previsão foram desenvolvidos na linguagem R de programação estatística utilizando o R Studio. Apesar do histórico em análise seja pequeno (02 anos), o melhor modelo obtido foi o de Tendência Quadrática obtendo a melhor performance na avaliação através dos MAPEs resultantes.