Captura de Tela 2016-12-01 às 16.28.07

Modelo Preditivo: Introdução para iniciantes

Se você não é um cientista de dados nem trabalha próximo à um, todo esse papo de análise de dados, big data e modelo preditivo pode ser muito confuso, e frustrante. Até os conceitos mais básicos da área podem parecer um bicho de 7 cabeças para os iniciantes.

Afinal, pesquisadores da Universidade da Carolina do Sul, nos EUA revelaram que em 2007 já existiam 295 exabytes de dados disponíveis no planeta, extraídos de computadores pessoais, empresariais e servidores de internet. (TecMundo)

295 exabytes = 316753838080 GIGABYTES

Pouquinho não é mesmo? Ah, outro detalhe, este cálculo foi realizado em 2007, e os mesmos pesquisadores divulgaram que a cada ano, a quantidade de informação do mundo cresce mais de 50% ao ano. Se estamos em 2016 então…é isso mesmo, loucura! (TecMundo)

Mas você não está sozinho nessa confusão, e por aqui, tentamos traduzir todo esse papo maluco em conhecimento didático para você.

Por isso, vamos lá!

Modelo preditivo tem 3 aspectos importantes que precisam ser entendidos separadamente:

1 – Coletar dados

Dados que descrevem o problema, ou possuem informações e características dos produtos, sujeitos a serem analisados. Estes dados podem vir de várias fontes distintas. Algumas das fontes mais comuns de dados de uma organização, por exemplo, são:

Dados internos:

  • Perfis de clientes, coletados através de formulários de assinatura ou pedido
  • Relacionamento com os clientes, como ligações, e-mails e chat de suporte ao consumidor
  • Dados transacionais, como compras efetuadas por consumidores
  • Dados provenientes de engajamento dos consumidores com o site da empresa, como quais páginas os consumidores clicaram para obter mais informações

Dados externos:

  • Mídias sociais: Facebook, Twitter, LinkedIn, Youtube
  • Dados públicos do governo: Dados sobre empresas, municípios, estados; IBGE; Indicadores econômicos
  • Dados abertos: Informações meteorológicas ou vindo de organizações de pesquisa

2 – Ensinar o modelo

Após a análise dos dados coletados, é necessário identificar qual algoritmo é o mais apropriado para utilizar para ensinar o modelo como fazer as relações que você quer que ele faça entre os dados coletados.

Ok, compliquei de novo, não é mesmo? Então vamos descomplicar. Você deve estar se perguntando o que diabos é um algoritmo. Você pode até ter ouvido falar sobre ele mas não sabe exatamente o que é, certo?

Bom, para que você consiga que o seu computador faça qualquer coisa, é necessário que você crie um programa para isso. Para criar o programa, você precisa informar ao computador o que fazer e como fazer o que você quer. E é aqui que chegamos no algoritmo, que são os passos necessários para fazer o que precisa.

Que tal um exemplo?

Vamos dizer que você mora longe da sua avó e precisa ensiná-la a usar o Skype (#StoryOfMyLife). Para isso você irá informá-la um algoritmo para que consiga se comunicar. Este algoritmo seria o seguinte:

  1. Clique com o mouse (importante ressaltar) no ícone (desenho) de um “S” branco em um fundo azul;
  2. No campo conta escreva utilizando o teclado (outra informação importante) o seguinte: vo@gmail.com;
  3. Clique no botão conectar;
  4. No campo senha escreva: voconectada;
  5. Clique no botão entrar.

E assim por diante. Acho que deu para entender não é mesmo?

Assim como você utilizou instruções para treinar a sua avó, você pode usar uma fórmula matemática para treinar o modelo preditivo.

O algoritmo que treinará o modelo preditivo irá utilizar alguns dados de exemplo para fazer isso. Isso significa que o algoritmo irá conhecer estes exemplos e, a partir deste conhecimento, será capaz de predizer eventos futuros, em situações similares aos exemplos.

Vamos ver um exemplo bem simples para facilitar:

Suponha que queremos criar um modelo preditivo que seja capaz de predizer se um filme (que ainda não foi lançado) será um sucesso de bilheteria ou não, dadas algumas informações sobre ele.

Neste caso, o algoritmo irá obter conhecimento a partir de dados de filmes que já foram lançados e que já se sabe se eles foram um sucesso de bilheteria:

Captura de Tela 2016-12-01 às 15.41.41(Exemplo retirado do livro Inteligência Artificial, Ben Coppin)


Com base no conhecimento extraído destes dados, o algoritmo treina um modelo capaz de predizer se um filme (que ainda não foi lançado) será ou não um sucesso de bilheteria, baseado nas informações de país de origem, grande estrela e gênero.(Exemplo retirado do livro Inteligência Artificial, Ben Coppin)

3 – Fazer predições

Uma vez que o modelo preditivo tenha sido treinado, é possível apresentar as características de um filme (que ainda não foi lançado) a ele, que será capaz de predizer (com um certo grau de certeza) se o filme será ou não um sucesso de bilheteria.

Com estes aspectos em mente, podemos concluir que um modelo preditivo é uma função matemática que, aplicada a uma grande quantidade de dados, descobre padrões até então desconhecidos sobre os dados e prevê acontecimentos futuros. (CIO)

ad prisma 2-01

Fonte: CIO, TecMundo

_________________________________________________________________________

Faiga Fialho Schmidt
Marketing Team
faiga.schmidt@bravi.com.br
Veja o perfil completo

Mariana
Data Scientist
mariana.lopes@bravi.com.br
Veja o perfil completo