A ideia de curadoria de dados não é nova. Com o aumento da capacidade computacional, de um lado, e o imenso fluxo de dados gerado pela Internet, de outro, passou a ser possível a integração de diversas fontes de informação, ultrapassando as barreiras das bases relacionais em bancos de dados corporativos.
Dados não estruturados, como grandes massas de texto, imagens e vídeos; informações derivadas do uso de um sem número de dispositivos, no que depois convencionamos chamar de Internet das Coisas (IoT) e um brutal conjunto de dados e metadados, principalmente ligados às nossas ações na internet passaram a ser integrados com o objetivo de gerar inteligência efetiva de negócio.
O efeito colateral? Junto com a informação boa e útil muita informação errada e inútil passou a ser coletada. Em 2007, o Gartner fez um alerta: mais de 25% dos dados críticos das 1000 maiores empresas, listadas pela Fortune, eram não confiáveis¹. E sem informação correta, útil e, principalmente, confiável, não é possível criar um sistema eficaz de tomada de decisão baseada em dados.
Curadoria de dados contra o “risco da decisão errada”
Da necessidade de mitigar o que podemos chamar de “risco da decisão errada” surgiu, portanto, a curadoria de dados, com o objetivo de prover suporte tanto tecnológico quanto metodológico no sentido de abordar o problema da qualidade dos dados, maximizando sua utilidade². Não se trata apenas de uma decisão sobre quais dados devem ficar e quais devem ser descartados, mas principalmente como estruturá-los para que se possa extrair a melhor informação para a tomada de decisão.
Da necessidade de mitigar o risco da decisão errada surgiu, a curadoria de dados.

Curadoria de dados no Marketing
No marketing, uma boa curadoria de dados garante, numa abordagem macro, a criação de inteligência, ou seja, de análises estatísticas capazes de orientar as ações da empresa a partir de uma visão ampla, que pode ser segmentada em diversos aspectos como posicionamento das ofertas, definição e abordagem de marcados alvo e até a identificação de novas oportunidades ainda não exploradas pela própria empresa ou pelos concorrentes.
Numa abordagem micro, permite a criação de perfis precisos, dando à empresa a capacidade de ‘entender’ precisamente os hábitos e as necessidades de clientes e potenciais clientes, em grandes e complexos sistemas de CRM (Customer Relationship Management). E tudo isso podia ser feito de modo integrado.
Podia, porque as novas legislações de proteção de dados pessoais mudaram as regras do jogo. E isso muda, também, a forma de ser fazer curadoria de dados. Ao “risco da decisão errada”, acrescenta-se agora os “riscos regulatórios” e os “custos de tratamento de dados pessoais”. Não vai ser mais possível capturar, armazenar e processar todos os dados disponíveis com a mesma liberdade da qual dispunham as empresas antes da entrada em vigor destas legislações.
Tratamento dos dados pessoais
Agora, além da oportunidade, será obrigatório avaliar, dentre outros aspectos, a finalidade e a necessidade do tratamento de dados pessoais, principalmente quando se fala em dados captados sem o consentimento do titular. Só para dar um exemplo: dados de navegação, de um usuário específico, em um portal de conteúdo de uma determinada empresa poderão ser diretamente associado ao seu perfil pessoal, também mantido pela empresa? Na maioria dos casos, não! Simplesmente porque não foram captados com esta finalidade e ferem as legítimas expectativas do titular dos dados.
Além disso, são constantes as previsões, nestes regramentos, que vedam a classificação de pessoas e a discriminação baseada perfis. E, para quem pensa que isso está longe do marketing, vale a leitura atenta do Capítulo 4, do fantástico livro de Cathy O´Neil, “Weapons of Math Destruction” (um trocadilho com “Weapons of Mass Destruction”, que se perde nesta possível tradução em português: “Armas de Destruição Matemática”).

Dados: o “novo petróleo”
Esse ‘novo petróleo’, como estão sendo chamados os dados pessoais, ao contrário do original, é extraído de nossas ações, de nossas opiniões e até de nossas emoções. São ativos importantes para as empresas, mas também representam uma porção da nossa personalidade que, por este motivo, merecem ser protegidos e terem sua utilização restringida dentro de limites aceitáveis.
A pergunta que se coloca, agora, para as empresas é a seguinte: como preservar os direitos da personalidade, a partir da proteção dos dados pessoais dos titulares, sem destruir completamente os modelos de tomada de decisão, principalmente de marketing, baseados nestes dados?
As melhores respostas a esta pergunta ainda estão para ser construídas, mas passam, necessariamente, pela separação entre a geração de dados para inteligência de marketing (visão macro, citada acima) da alimentação das plataformas de CRM (visão micro). Será fundamental deixar claro, para o usuário, a partir de que momento seus dados serão coletados com o objetivo de enriquecer bases de perfil, deixando claras a finalidade e a necessidade do tratamento destes dados, além de dar-lhe a oportunidade, sempre que possível, de continuar sem fornecê-los.
Dados já coletados no passado
E os dados anteriores a este momento, estão perdidos? Não necessariamente. Poderão ser utilizados para fins de inteligência de marketing, desde que anonimizados (ou pseudo-anonimizados). E é neste ponto que a separação entre inteligência e CRM passa a fazer ainda mais sentido, exigindo uma camada de inteligência (e anonimização) fora da estrutura de dados corporativos de marketing, que entregue resultados consolidados e anônimos que possam ser agregados a outras fontes de dados para a tomada de decisão.
Só assim será possível, no futuro, garantir a privacidade e o respeito aos direitos da personalidade dos consumidores, minimizando as perdas em inteligência de marketing.
¹ SWART, N. Gartner Warns Firms of ‘Dirty Data’. Information Management Journal, [s. l.], v. 41, n. 3, p. 6, 2007.
² FREITAS, A.; CURRY, E. Big Data Curation. In: CAVANILLAS, J. M.; CURRY, E.; WAHLSTER, W. (Eds.). New Horizons for a Data-Driven Economy: A roadmap for Usage and Exploitation of Big Data in Europe. [s.l.] : Springer Open, 2016. p. 87–118.
Dúvidas mais comuns
-
-
Curadoria de dados é o processo de organização, integração e tratamento de dados coletados de diversas fontes, com o objetivo de garantir sua qualidade, confiabilidade e utilidade para a tomada de decisão. Envolve não apenas decidir quais dados devem ser mantidos ou descartados, mas principalmente estruturá-los adequadamente para extrair a melhor informação possível, maximizando seu valor para a organização.
-
-
A curadoria de dados é fundamental porque mitiga o 'risco da decisão errada'. Estudos mostram que mais de 25% dos dados críticos das maiores empresas são não confiáveis, o que compromete a eficácia dos sistemas de tomada de decisão. Uma boa curadoria garante que as informações utilizadas sejam corretas, úteis e confiáveis, permitindo que as empresas façam escolhas estratégicas mais assertivas baseadas em dados de qualidade.
-
-
No marketing, a curadoria de dados funciona em duas abordagens complementares: na visão macro, cria inteligência através de análises estatísticas que orientam as ações da empresa, permitindo segmentação de mercado, posicionamento de ofertas e identificação de novas oportunidades; na visão micro, permite criar perfis precisos de clientes em sistemas de CRM, possibilitando entender hábitos e necessidades específicas. Ambas as abordagens podem ser integradas para gerar insights mais completos.
-
-
As legislações de proteção de dados pessoais alteraram significativamente as práticas de curadoria. Agora, além de mitigar o risco da decisão errada, as empresas precisam considerar riscos regulatórios e custos de tratamento de dados pessoais. Não é mais possível capturar, armazenar e processar todos os dados disponíveis livremente. É obrigatório avaliar a finalidade e necessidade do tratamento, respeitar o consentimento dos titulares e evitar discriminação baseada em perfis.
-
-
A inteligência de marketing (visão macro) utiliza dados para gerar análises consolidadas e anônimas que orientam decisões estratégicas da empresa, enquanto o CRM (visão micro) alimenta perfis individuais de clientes para personalização e relacionamento. A separação entre essas duas abordagens é fundamental para respeitar a privacidade: dados históricos podem ser anonimizados para inteligência, enquanto dados novos devem ser coletados com consentimento explícito e finalidade clara para uso em CRM.
-
-
Dados coletados antes das novas legislações podem ser utilizados para fins de inteligência de marketing desde que sejam anonimizados ou pseudo-anonimizados. Para isso, é necessário criar uma camada de inteligência separada da estrutura de dados corporativos de marketing, que processe esses dados de forma anônima e entregue resultados consolidados que possam ser agregados a outras fontes. Essa abordagem permite preservar a privacidade dos consumidores enquanto mantém a capacidade de gerar insights de marketing.
-
-
O 'risco da decisão errada' refere-se ao perigo de tomar decisões empresariais baseadas em dados incorretos, incompletos ou não confiáveis. Com o aumento exponencial do volume de dados, muita informação errada e inútil é coletada junto com dados válidos. Sem uma curadoria adequada que garanta a qualidade e confiabilidade dos dados, as empresas correm o risco de fazer escolhas estratégicas equivocadas que prejudicam seus resultados.
-
-
O principal desafio é equilibrar a necessidade de gerar inteligência de marketing com a obrigação de proteger os direitos da personalidade e privacidade dos consumidores. As empresas precisam definir claramente quando e como os dados serão coletados, comunicar a finalidade do tratamento aos usuários, e oferecer oportunidades para que eles optem por não fornecer seus dados. As melhores soluções passam pela separação clara entre inteligência (dados anonimizados) e CRM (dados pessoais com consentimento), exigindo novas estruturas tecnológicas e metodológicas.