'Big data' é a nova ciência de entender e prever o comportamento humano, estudando grandes volumes de dados não estruturados. Big data também é conhecido como 'análise preditiva'.
A análise de posts no Twitter, feeds do Facebook, buscas no eBay, rastreadores de GPS e caixas eletrônicos são exemplos de grandes dados. Estudar vídeos de segurança, dados de tráfego, padrões climáticos, chegadas de voos, registros de torre de celular e rastreadores de frequência cardíaca são outras formas. O Big Data é uma nova ciência confusa que muda semanalmente e apenas alguns especialistas entendem tudo.
Quais são alguns exemplos de Big Data em vida regular?
Enquanto a maioria dos projetos de big data é muito obscura, existem exemplos bem-sucedidos de big data que afetam a vida cotidiana de indivíduos, empresas e governos:
Previsão de surtos de vírus: estudando dados sociopolíticos, dados meteorológicos e climáticos e dados hospitalares / clínicos, esses cientistas agora estão prevendo surtos de dengue com 4 semanas de antecedência.
Homicide Watch: Este projeto de big data projeta vítimas de assassinato, suspeitos e criminosos em Washington, DC. Tanto como forma de honrar o falecido e como um recurso de conscientização para as pessoas, este projeto de big data é fascinante.
Planejamento de viagens em trânsito, NYC: O programador de rádio do WNYC, Steve Melendez, combinou a programação do metrô on-line com o software de itinerário de viagem. Sua criação permite que os nova-iorquinos cliquem em sua localização no mapa, e uma previsão do tempo de viagem para trens e metrô será exibida.
A Xerox reduziu a perda de força de trabalho: o trabalho no call center é emocionalmente desgastante. A Xerox estudou uma grande quantidade de dados com a ajuda de analistas profissionais, e agora eles podem prever quais contratações de call center provavelmente permanecerão na empresa por mais tempo.
Apoiando o combate ao terrorismo: Ao estudar as mídias sociais, registros financeiros, reservas de voos e dados de segurança, a aplicação da lei pode prever e localizar suspeitos de terrorismo antes que eles realizem seus atos perversos.
Ajustando o marketing da marca com base em avaliações de mídia social: pessoas sem rodeios e rapidamente compartilham seus pensamentos on-line em um pub, restaurante ou clube de fitness. É possível estudar esses milhões de postagens nas mídias sociais e fornecer feedback para a empresa sobre o que as pessoas pensam de seus serviços.
Quem usa Big Data? O que eles fazem com isso?
Muitas corporações monolíticas usam big data para ajustar suas ofertas e preços para maximizar a satisfação do cliente.
- Loja de departamentos Macy's, por exemplo, usa big data para ajustar seus preços rapidamente para mais de 70 milhões de produtos. Eles até enviam e-mails personalizados para seus clientes com base no que a Macy's acredita estar interessada.
- Resposta da polícia ao bombardeio da Maratona de Boston: com o uso de big data para estudar imagens de vídeo e vigilância, a polícia conseguiu diminuir rapidamente a busca pelos suspeitos.
- Churrascaria de Morton usa o Twitter para realizar acrobacias de marketing, incluindo a famosa entrega no aeroporto de Nova Jersey de um jantar de filé e camarão.
- O Visa usa big data para identificar e capturar fraudadores.Transações simples aqui e ali podem facilmente ocultar um usuário de cartão de crédito desonesto, mas observando milhões de transações cuidadosamente, os padrões de fraude podem ser detectados.
- Facebook usa big data para personalizar publicidade. Ao estudar cuidadosamente seus gostos e hábitos de navegação, o gigante da mídia social tem uma visão estranha de seu gosto. Os anúncios da barra lateral que você vê no seu feed do Facebook são escolhidos por algoritmos muito deliberados e complexos que estão acompanhando seus hábitos no Facebook.
Por que os Big Data são tão grandes?
4 coisas tornam o big data significativo:
1. Os dados são enormes. Não cabe em um único disco rígido, muito menos em um pendrive. O volume de dados excede em muito o que a mente humana pode perceber (pense em um bilhão de bilhões de megabytes e depois multiplique isso por mais bilhões).
2. Os dados são confusos e não estruturados. 50% a 80% do trabalho de big data é converter e limpar as informações para que possam ser pesquisadas e classificadas. Apenas alguns milhares de especialistas em nosso planeta sabem como fazer essa limpeza de dados. Esses especialistas também precisam de ferramentas muito especializadas, como HPE e Hadoop, para fazer seu trabalho. Talvez em 10 anos, os especialistas em big data se tornem um centavo a dúzia, mas por enquanto, eles são uma espécie muito rara de analista e seu trabalho ainda é muito obscuro e tedioso.
3. Os dados se tornaram uma mercadoria ** que pode ser vendida e comprada. Mercados de dados existem onde empresas e indivíduos podem comprar terabytes de mídias sociais e outros dados. A maioria dos dados é baseada em nuvem, pois é muito grande para caber em um único disco rígido. A compra de dados geralmente envolve uma taxa de inscrição na qual você se conecta a um farm de servidores na nuvem.
** Os líderes de ferramentas e ideias de big data são Amazon, Google, Facebook e Yahoo. Como essas empresas atendem a tantos milhões de pessoas com seus serviços on-line, faz sentido que elas sejam o ponto de coleta e os visionários por trás da análise de big data.4. As possibilidades de big data são infinitas. Talvez os médicos possam um dia prever ataques cardíacos e derrames para indivíduos semanas antes de eles acontecerem. Avarias e colisões de automóveis podem ser reduzidas por análises preditivas de dados mecânicos, tráfego e padrões climáticos. O namoro on-line pode ser melhorado com previsões de dados grandes sobre quem são personalidades compatíveis para você. Os músicos podem obter informações sobre qual composição musical é a mais agradável aos gostos mutáveis do público-alvo.Nutricionistas podem prever qual combinação de alimentos comprados em lojas irá agravar ou ajudar as condições médicas de uma pessoa. A superfície foi apenas arranhada e as descobertas em big data acontecem toda semana.
Big Data está desarrumado
Big data é uma análise preditiva: a conversão de dados massivos não estruturados em algo pesquisável e classificável. Este é um espaço bagunçado e caótico que requer um tipo especial de conhecimento e paciência.
Tomemos por exemplo o serviço de entrega monolítico da UPS. Os programadores da UPS estudam dados do GPS e dos smartphones de seus motoristas para analisar as formas mais eficientes de se adaptar ao congestionamento de tráfego. Esses dados de GPS e smartphone são gigantescos e não estão automaticamente prontos para análise. Esses dados chegam de vários bancos de dados de mapas e GPS, através de diferentes dispositivos de hardware para smartphones. Os analistas da UPS passaram meses convertendo todos esses dados em um formato que pode ser facilmente pesquisado e classificado. O esforço valeu a pena, no entanto. Hoje, a UPS economizou mais de 8 milhões de galões de combustível desde que começou a usar essas análises de big data.
Como o big data é confuso e exige muito esforço para limpar e preparar o uso, os cientistas de dados passaram a ser apelidados de "zeladores de dados" por todo o trabalho tedioso que fazem. Detalhes
A ciência do big data e da análise preditiva está melhorando a cada semana, no entanto. Espere que o big data fique prontamente acessível a todos até o ano de 2025.
Big Data não é uma ameaça intrusiva à privacidade?
Sim, se nossas leis e defesas de privacidade individuais não forem cuidadosamente gerenciadas, então os big data invadem a privacidade pessoal. Atualmente, o Google, o YouTube e o Facebook já rastreiam seus hábitos on-line diários. Seu smartphone e sua vida de computação deixam impressões digitais todos os dias, e empresas sofisticadas estão estudando essas pegadas.
As leis sobre big data estão evoluindo. A privacidade é um estado de que você deve assumir agora a responsabilidade pessoal, já que você não pode mais esperar isso como um direito padrão.
O que você pode fazer para proteger sua privacidade:
O maior passo que você pode dar é encobrir seus hábitos diários usando uma conexão de rede VPN. Um serviço VPN embaralha seu sinal para que sua identidade e localização sejam, pelo menos parcialmente, mascarados dos rastreadores. Isso não tornará você 100% anônimo, mas uma VPN reduzirá substancialmente o quanto o mundo pode observar seus hábitos on-line.
Onde posso aprender mais sobre Big Data?
Big data é uma coisa fascinante para pessoas com mentes analíticas e um amor pela tecnologia. Se é você, então definitivamente visite esta página de projetos interessantes de big data.