Corredor gosta de cerveja e cachorros
29/01/14 10:38Já que este não é um blog de tecnologia, começo falando de “big data”. Odeio ficar usando expressões em línguas exógenas, mas algumas acabam sendo tão dominantes que acabam virando parte de uma espécie de idioma internacional da área de negócios em geral.
A tal de big data é mais uma expressão para essa série do novo léxico internacional. Refere-se à grande quantidade de informações em formato digital que a humanidade vem produzindo nos últimos 50 anos, mormente neste século.
Apesar de, na aparência, ser uma expressão substantiva, “informaçãozona” ou “informações em enorme quantidade”, na verdade é uma expressão verbal, de ação, porque sempre nos referimos ao uso da big data, a como usar big data ou a conhecimentos que conseguimos por meio da análise dessas grandes quantidades de informações aparentemente dissociadas.
A análise é, pois, o ponto fulcral; não basta ter muito, é preciso saber usar. Vai daí o conceito, também expresso em idioma outro que não a última flor do lácio, de data mining, mineração de informações, peneira da dados.
As empresas peneiram enormes quantidades de dados no afã de descobrir algo sobre uma comunidade, um grupo de pessoas, um produto ou qualquer outra coisa. Há um conhecido experimento do Google que usou o monitoramento de redes sociais para prever a eclosão de epidemias de gripe.
Vai daí que ganha enorme importância o tipo de “peneira” usado, ou seja, a ferramenta eletrônica empregada para mapear os dados. Empresas que criam esse tipo de produto procuram demonstrar ao mundo que ele funciona e que pode dar resultados efetivos ou, pelo menos interessantes, que é capaz de juntar cré com lé e produzir cifrões –afinal de contas, o objetivo de tudo isso é gerar informação comprável ou vendável.
E assim chegamos ao mundo da corrida. Uma das empresas que desenvolvem esse tipo de ferramenta de mineração e análise de grande quantidade de dados resolveu empregar seu produto para produzir um perfil de pessoas que, no Twitter, se dizem corredores e/ou falam sobre kms ou km.
Os resultados são curiosos, mas, antes de prosseguir, devo dizer que, baseado apenas nos parcos conhecimentos que tenho de estatística e em entrevistas que já fiz com estatísticos e renomados analistas de mercado e produtores de pesquisas eleitorais, eles NÃO TÊM relevância estatística.
Isso significa dizer que, por maior que seja a amostra utilizada, os resultados NÂO PODEM ser extrapolados para o universo dos corredores brasileiros. Ou, dizendo de outra forma, a amostra utilizada NÃO REPRESENTA o universo dos corredores brasileiros, mas tão somente a própria amostra.
O que não significa que, como disse antes, os resultados não sejam bacanas ou não permitam fazer algumas análises específicas de mercado. São e permitem, e é por isso que estou falando deles aqui. Afinal, ela REPRESENTA um enorme contingente de corredores conectados.
Bom, a empresa de monitoramento é a E.life. De junho a novembro do ano passado, analisou os dados públicos de 374.312 perfis individuais identificados como corredores.
Descobriram que homens costumam citar mais marcas, enquanto mulheres se atêm mais ao relato da atividade. Além de corrida, praticam outros exercícios: vão à academia, andam de bicicleta e jogam futebol. Do ponto de vista das profissões, há mais engenheiros, advogados e professores, mas os fotógrafos surpreendem, chegando em quinto lugar, atrás dos administradores de empresa. Falo surpreendem porque, apesar de não ter dados estatísticos, duvido que, na sociedade brasileira, fotógrafo seja a quarta profissão mais populosa.
Sobre os assuntos tratados além da corrida, o tema mais citado foi a própria internet; em seguida, menções relacionadas a remédios, especialmente analgésicos. Outros temas com grande número de menções foram cerveja e bichinhos de estimação. Bancos, equipamentos eletrônicos, supermercados e refrigerantes também são muito citados nos tweets dos perfis analisados.
O estudo ainda fez outras peneiradas, vinculadas a marcas, como a de banco ou supermercado mais citado, além de demonstrar temas mais citados por perfis que citam marcas de produto de corrida. Prefiro não entrar nesse terreno, porque já fica perigosamente próximo ao da propaganda e não vejo relevância para a compreensão mais geral dos corredores.
Bueno, de qualquer forma, fica registrado que o mundo dos corredores conectados já foi alvo, é e continuará sendo tema de análise das empresas, pois forma um universo mobilizado e interessado em comprar coisas de sua área e mesmo fora dela, como se vê.
PS.: Agradeço a você e a todos que vêm comentando o meu projeto de percorrer 460 km por São Paulo, o balanço e as reportagens a respeito O trabalho foi feito para você. Obgd, abs e vamo que vamo!
Prefiro 1000 vezes vinhos e gatos….
muito chato.
Muito legal.
Data mining é o bicho da goiaba!
Também falo muito (mal) do armazém da minha “cidadinha” 🙂