7 passos para o sucesso empresarial com dados grandes

Acesse:http://gigaom.com/cloud/richeson-big-data/

Já não a nova tecnologia no bloco, os dados grandes continua a gerar buzz significativa. Tecnologias como o Hadoop e HBase estão vendo o rápido crescimento, os analistas estão experimentando novas técnicas e abordagens, e líderes empresariais estão se adaptando seus modelos de negócios para confiar mais no poder dos dados grande. McKinsey chamadas de dados grande o “próxima fronteira” para os negócios, com potencial para transformar o negócio da mesma forma que a Internet fez ao longo dos últimos 15 anos.

Para aproveitar esse potencial, os líderes empresariais precisam saber quais as medidas a tomar a fim de aproveitar ao máximo seus ativos de dados. O sucesso do negócio com dados grandes não é apenas sobre como escolher as tecnologias cloud direita ou a contratação de cientistas inteligentes de dados – é sobre a criação de uma abordagem centrada nos negócios que conecta dados de uma empresa à sua estratégia de negócio, permite a melhoria contínua, e segue até os processos de impacto, as margens e satisfação do cliente.

Na minha experiência com os dados grande que tenho desenvolvido sete passos que podem ajudar o sucesso de qualquer unidade de líder empresarial mais com as suas iniciativas de dados grande.

1. Crie uma estratégia para seus dados

Seus dados precisa de uma estratégia forte, que se conecta e sustenta a sua estratégia de negócios e também se integra com nível de departamento responsabilidades.Desenvolver um plano para onde você quer estar em cada etapa, definir o seu futuro claramente capacidades, e descrever como os recursos de seus dados serão utilizados.Em seguida, mantenha seus usuários responsáveis ​​por onde e como eles vão usar as novas capacidades, e que o impacto nos negócios eles vão dirigir.

Por exemplo, se você pode usar dados grande para melhorar as vendas na loja, você precisa não só trabalhar com os gerentes de loja para definir as capacidades que se conectam à sua estratégia, mas também garantir os gestores são responsabilizados a usar os recursos de dados corretamente e entregar o impacto pretendido. Fazê-lo conecta ambos os seus e os seus objectivos para a estratégia global de negócios, ajuda a criar capacidades mais utilizáveis, e garante que qualquer iterações necessário será feito em conjunto. A bem concebida estratégia de dados vai lhe dar a maioria de estrondo para o fanfarrão do seu investimento em dados.

2. Projeto para a agilidade

Grandes sistemas de dados são apenas isso … grande, o que significa que eles tendem a ser inflexíveis. Um grande sistema de BI, por definição, irá causar um negócio à mudança, que por sua vez, exigem o sistema de BI para mudar. Assim, os sistemas precisam se adaptar rapidamente para manter o ritmo com o seu negócio. Doze ou 18 meses ciclos de lançamento são apropriadas para certas partes de seu sistema, mas três – ou 6 meses ciclos pode ser apropriado para outros. Analisar cuidadosamente cada componente do seu sistema de dados grande, e design para a quantidade certa de agilidade que você precisa.

Você pode decidir construir níveis mais elevados de automação para as camadas do seu stack que mudam lentamente, reservando configuração baseada em abordagens para as camadas do seu stack que precisam mudar rapidamente. Em geral, as camadas superiores do seu stack (por exemplo, interfaces de usuário e ferramentas de informação) precisa ser mais ágil do que as camadas inferiores do seu stack (por exemplo, coleta de dados e armazenamento), mas muitas exceções a esta regra existe.Somente uma análise cuidadosa e compreensão de seus usos atuais e futuros de dados irá permitir-lhe tomar as decisões corretas na agilidade. Projetando para a agilidade permitirá que o seu investimento grande de dados para acompanhar o ritmo, e até levar, o seu negócio.

3. Entenda latências

A latência é um desafio em sistemas tradicionais de BI, e os dados grandes só amplifica o problema. Soluções Big dados tendem a ser arquitetado primeiro como sistemas batch, com capacidades de latência mais baixa a ser abordadas mais tarde. Não guardar a latência para o último – analisar os cenários de utilização chave em termos de latência, e conectá-los claramente aos condutores de negócios. Foco na entrega a latência certa para cada necessidade, incluindo o valor a ser conduzido, e deixar essas necessidades conduzir o seu design. Certas necessidades de baixa latência pode exigir ignorando o seu sistema de dados grandes temporariamente, partilha diretamente entre sistemas, a fim de oferecer cenários específicos.

Por exemplo, se os seus clientes tendem a interagir com o sistema A e B do sistema em paralelo ou em seqüência rápida, estes dois sistemas podem precisar compartilhar dados diretamente. Os dados podem ser escritos no sistema de dados grande no tempo a ser utilizado por outros sistemas. Entregar os dados em uma base de tempo real ou quase em tempo real pode ser muito caro, assim, é melhor pensar em termos de “certo tempo” dados direcionados para cada necessidade.

Descrever os requisitos de latência em detalhe, e garantir a justificação do negócio é som. Latências entendimento irá permitir-lhe entregar os dados exatamente quando ela é necessária, mantendo os custos sob controle.

4. Investir na qualidade dos dados e metadados

Qualidade dos dados em qualquer sistema é uma batalha constante, e grandes sistemas de dados não são excepção, no entanto, grandes sistemas de automação de dados exigem muito mais e planejamento antecipado. Você deve primeiro assegurar que a qualidade dos dados não é tratado como um projeto ou iniciativa, mas como uma camada de fundação de sua pilha de dados que recebe mobilização adequada de recursos e atenção da administração. Em segundo lugar, construir em várias linhas de defesa – de masterização de dados (onde, por exemplo, você está criando contas de clientes) para coleta de dados (onde está a gravar todas as interações que o cliente está com você) para metadados (onde você está organizando e dimensionalizing o dados para auxiliar na elaboração de futuros relatórios e análise). Terceiro, automatizar tanto os processos que identificam e elevar os problemas de qualidade de dados, ea medição e comunicação de dados de progresso de qualidade. Capacitar sua equipe de qualidade de dados com ferramentas que resolvem os problemas em escala elevada, tais como ferramentas de diagnóstico e fluxo de trabalho. Eficientes práticas de qualidade de dados permitirá que o seu sistema de dados grande de ganhar o seu lugar como uma entrada de confiança para os processos de negócios-chave.

5. Ficar bom em prototipagem

Os tamanhos de dados na maioria dos grandes sistemas de dados são muito grandes para trabalhar com todos ao mesmo tempo, por isso é geralmente mais sábio para construir pequenos protótipos para resolver as rugas e garantir que estão reunidos os requisitos do cliente. Se você está construindo integrações de dados complexos, algoritmos online, ou interfaces de usuário, prototipagem permite que você aprenda a uma escala menor e menos onerosa. Além do mais, os protótipos podem ser compartilhados cedo com sua base de usuários, o que gera um feedback valioso, bem como excitação.

Prototipagem requer habilidades um tanto original que você precisa para construir e aperfeiçoar ao longo do tempo. Prototypers precisa ser capaz de se mover rapidamente, descobrir novos designs e tecnologias, entender os cenários do usuário, ativamente solicitar feedback, e não tenha medo de falhar. Eles precisam ser criativo em sua abordagem para resolver problemas, enquanto ainda enraizada na mecânica do som de dados. Por que é prototipagem melhor do que wireframes ou listas de recurso? Uma vez que os protótipos são “real”, seus usuários vão lhe dar uma melhor feedback; ao mesmo tempo você também vai compreender alguns dos desafios que enfrentará como você construir a versão em grande escala. Construção de uma forte capacidade de prototipagem vai ajudá-lo a aumentar a inovação e velocidade, reduzindo o custo de erros.

6. Get grande em amostragem

Amostragem você vai economizar muito tempo se você aprender como fazê-lo corretamente. Há muitos casos de uso para os quais a amostragem é uma alternativa eficaz ao uso de censo completo (100 por cento) de dados. Certas necessidades como a criação de experiências personalizadas para cada cliente, ou calcular métricas de responsabilidade executiva, não são apropriados para a amostragem. Mas para muitas outras necessidades, a amostragem é uma opção viável.

Por exemplo, a compreensão desempenho do produto ou recurso, olhando para padrões e tendências ao longo do tempo, e filtragem de anomalias inesperadas podem normalmente ser feito em dados amostrados. Uma abordagem é coletar 100 por cento dos dados, mas a maioria de sua análise em amostras, e confirme conclusões importantes sobre o conjunto de dados completo. Depois de estabelecer os fluxos de processos para extrair dados amostrados em ferramentas padrão como Excel e / ou SQL, você verá aumentar a produtividade analista substancialmente, o que vai lhe poupar tempo e dinheiro e aumentar a satisfação do trabalho de seus analistas.

Para obter grande em amostragem, que você precisa fazer três coisas: primeiro, desenvolver padrão de conjuntos de dados amostrados que ajudam o seu endereço de analistas de grandes áreas de questões comerciais, atualizando-os regularmente, em segundo lugar, verifique se você tem pelo menos um indivíduo altamente qualificados (ou seja, um estatístico), que pode garantir os dados estão sendo amostrados corretamente e os resultados não são mal aplicados, e terceiro, educar os tomadores de decisão sobre os benefícios e limitações de amostragem para que eles possam se sentir confortável tomada de decisões com dados amostrados. O uso efetivo de amostragem aumenta a produtividade e agregar valor aos negócios equivalentes.

7. Peça feedback regular

De dados é um grande processo de aprendizagem, tanto em termos de gestão de dados e na condução de valor comercial de seu conteúdo. Sua base de usuários internos é uma valiosa fonte de feedback e parte integrante de seu processo de aprendizagem e desenvolvimento. Seu programa de prototipagem será uma fonte de feedback, mas você também deve levantamento seus usuários e de referência o seu progresso ao longo do tempo. Áreas como a usabilidade, a qualidade dos dados e latência de dados são todas as categorias em que os usuários irão dar-lhe feedback. Além disso, você deve pedir feedback ad hoc de todos os níveis das organizações das partes interessadas para que seu ver o seu compromisso de tornar seus negócios melhores.

Como a reputação da sua ativos de dados cresce, seus stakeholders vai lhe dar feedback mais e melhor, o que lhe permitirá desenvolver metas integradas e roteiros, e dirigir beneficiar mais negócios como resultado. Feedback regular garante que o seu sistema de dados grande é fortemente integrado com a tomada de decisão, para que ele possa desempenhar um papel de liderança na melhoria dos negócios.

Seguindo os passos acima irá ajudá-lo a construir mais eficazes recursos de dados grandes, economizando tempo e dinheiro, e dirigir ROI máxima para o seu negócio. A fronteira de dados é grande aqui, rompendo requer uma compreensão de quais os passos que o ajudarão a conduzir o maior impacto.

Chad Richeson é o CEO da Society Consulting, uma análise baseada em Seattle, empresa de consultoria e tecnologia que oferece estratégias de negócios orientadas de dados, soluções e análises para seus clientes. Antes de ingressar na Sociedade Consulting em 2011, Chad passou 12 anos na condução e análise de soluções Microsoft grande de dados para Bing, MSN, Mobile e AdCenter.

Imagem cedida por  usuário do Flickr  Susan NYC .

Curiosidades na internet