A estrutura dos dados é a parte mais importante das análises, como se fosse os alicerces de uma casa. Se a base de dados estiver bem construída de raiz, consegue fazer todo o tipo de análises de forma muito rápida! Por isso, neste artigo vou partilhar consigo o que é o formato tabular – aquele que considero ser o formato ideal dos dados.
Características do Formato Tabular
Para ter o formato ideal dos dados, é necessário garantir que os dados estão organizados no Formato Tabular, em que cada linha representa uma transação, ou seja, a tabela deve sempre crescer para baixo e não para a direita.
Costumo dizer que está tudo bem em ter 10.000 linhas, mas não está tudo bem em ter 200 colunas!
O formato tabular, funciona num esquema de Perguntas e Respostas, onde nas colunas (cabeçalhos) tem as perguntas, e nas linhas tem as respostas:
Ora veja um exemplo dos dados organizados no formato tabular:
Pode ver que em cada coluna tem um tipo de dados, nos títulos tem uma pergunta, e em cada linha uma resposta!
Este formato segue algumas regras:
- Cada registo deve ser feito numa linha;
- Cada coluna deve conter um tipo de dados (categorias), por exemplo: data, n.º encomenda, quantidade;
- Não devem existir linhas ou colunas em branco;
- Os títulos das colunas devem estar apenas numa célula e localizados na primeira linha;
- Não deve haver linhas de subtotais ou totais intercalados nos dados.
Outros formatos comuns
Há formatos usados com frequência que apresentam os dados de uma forma simples e fácil de interpretar, mas que dificultam depois as análises.
É sempre possível fazer as análises pretendidas, no entanto o tempo despendido para o conseguir é bastante diferente conforme o formato dos dados.
No entanto, com o Power Query, consegue transformar e limpar os dados, de forma a ter este “formato ideal” para depois conseguir inserir, por exemplo, Pivot Tables (Tabelas Dinâmicas) e criar análises/dashboards/relatórios.
Deixo-lhe de seguida alguns exemplos de formatos não-tabular que não são os formatos ideais caso pretenda analisar os dados posteriormente:
- Pré-Relatório:
Nesta apresentação dos dados, já há alguns dados sumarizados (desnecessário), há colunas em branco (problema) e os títulos estão em duas linhas (problema).
Não conseguimos analisar os dados através de uma tabela dinâmica, porque esta não pode ter colunas em branco, nem títulos em duas linhas.
Por isso embora seja possível criar análises, estas demorariam muito mais tempo.
- Tabela de dados simples:
Neste tipo de apresentação de dados:
- o título das colunas está numa linha – OK;
- há colunas com níveis de sumarização – desnecessário;
- não há linhas ou colunas em branco – OK;
- não há linhas com subtotais ou totais – OK.
Já é possível usar estes dados numa pivot table, ainda assim ainda existem limitações uma vez que já existe alguma sumarização de dados.
Idealmente, em vez de ter colunas com a combinação País+Budget e País+Total (para cada país) deveria transformar em três colunas: País, Total e Budget. Isto é possível fazer com a ajuda do Power Query!
Como os dados estão apresentados se quiser analisar, por exemplo, as vendas dos diferentes países, teria de colocar todas as colunas dos países no campo valores. Se tivesse 50 países teria de colocar 50 colunas!
Portanto é possível usar numa tabela dinâmica, mas é mais complicado do que poderia ser.
- Formato entrada de dados:
Neste formato, a informação vai sendo atualizada a cada mês e vai crescendo para os lados (os novos meses).
Embora seja mais fácil para introduzir os dados, complica bastante as análises futuras, pois implica a utilização de várias fórmulas complexas.
- Formato Relatório:
Relatórios “bonitos” mas difíceis de trabalhar a informação.
Manipular estes dados consome muito tempo. Se quisesse criar uma análise da evolução das vendas ao longo do tempo, teria de ir buscar os dados a todas as tabelas que tivesse.
- Vários ficheiros, com várias folhas:
Até à existência do Power Query, era um formato bastante difícil de trabalhar. Requeria abrir muitos ficheiros e muitos copy-pastes, sendo um processo moroso. Mas com o Power Query isso mudou! É possível agregar todos os ficheiros/folhas de uma só vez.
Qual destes formatos utiliza com mais frequência? Nas suas análises costuma ter por base este formato ideal dos dados?
Relembro também que se pode inscrever no curso EXCELerate Your Skills. Este é um curso 100% online que ensina a usar as várias funcionalidades do Excel, assim como vários truques “escondidos” que muitos utilizadores avançados desconhecem, para que seja mais rápido, eficiente, produtivo… e até mesmo levá-lo a destacar-se na sua empresa! Todos os conteúdos em vídeo do curso são pré-gravados, que lhe permitem frequentar o curso ao seu próprio ritmo, quando e onde quiser.