Estou com uma dúvida que está na minha cabeça há alguns dias. Dei uma boa pesquisada mas não consegui chegar a uma resposta concreta então venho aqui pedir ajuda de vocês.
Já tinha uma noção de power bi r agora comecei o curso completo aqui. Sei todo o conceito de fato/dimensão, star schema etc, mas o que acontece é o seguinte, quando eu aprendi power bi, foi me ensinado que devemos ter uma tabela dimensão para tudo que queremos usar como filtro. E o processo para isso, quando não temos id para as dimensões, é duplicar a tabela fato, deixar apenas as colunas relevantes para a dimensão, remover as duplicatas, adicionar uma coluna de índice, mesclar essa coluna de índice na tabela fato e retirar as colunas desnecessárias.
Acontece que estou com um caso que tenho uma lista de jobs feitos pelo time e diversas colunas que não tem ligação entre si como por exemplo:
Tipo do job - se ele estava planejado, se não era planejado, se é uma alteração etc.
Peça - qual peça foi entregue no job
Responsável - quem fez o job
Status - se o job foi entregue, está sendo feito ou caiu
Cliente - para qual cliente o job foi feito
Além de outras colunas de números, como quantidade de peças, tempo em minutos, Pontuação para o job e mais algumas que não vem ao caso.
Para todas as colunas que citei, criei uma nova tabela dimensão a partir da fato e fiz todo o processo que citei acima. Porém, tenho diversas tabelas com apenas duas colunas (id e dados únicos) e além disso, tenho diversas etapas de mesclas de consultas na minha tabela fato, o que deixa o processamento mais lento e o arquivo mais pesado.
E em uma das aulas do Leo sobre o Power Query, ele cita que devemos evitar ao máximo mesclar consultas na tabela fato.
Minha dúvida é, existe algum outro jeito de fazer esse processo já que não tenho os id's? Eu deveria criar as tabelas dimensão apenas com os tipos únicos e não criar uma chave única, para não ter que fazer a mescla de consultas?
Sinto que estou fazendo do jeito errado, mas estou um pouco sem norte.
Pergunta
Danilo Kapor
Boa noite pessoal, tudo bem?
Estou com uma dúvida que está na minha cabeça há alguns dias. Dei uma boa pesquisada mas não consegui chegar a uma resposta concreta então venho aqui pedir ajuda de vocês.
Já tinha uma noção de power bi r agora comecei o curso completo aqui. Sei todo o conceito de fato/dimensão, star schema etc, mas o que acontece é o seguinte, quando eu aprendi power bi, foi me ensinado que devemos ter uma tabela dimensão para tudo que queremos usar como filtro. E o processo para isso, quando não temos id para as dimensões, é duplicar a tabela fato, deixar apenas as colunas relevantes para a dimensão, remover as duplicatas, adicionar uma coluna de índice, mesclar essa coluna de índice na tabela fato e retirar as colunas desnecessárias.
Acontece que estou com um caso que tenho uma lista de jobs feitos pelo time e diversas colunas que não tem ligação entre si como por exemplo:
Tipo do job - se ele estava planejado, se não era planejado, se é uma alteração etc.
Peça - qual peça foi entregue no job
Responsável - quem fez o job
Status - se o job foi entregue, está sendo feito ou caiu
Cliente - para qual cliente o job foi feito
Além de outras colunas de números, como quantidade de peças, tempo em minutos, Pontuação para o job e mais algumas que não vem ao caso.
Para todas as colunas que citei, criei uma nova tabela dimensão a partir da fato e fiz todo o processo que citei acima. Porém, tenho diversas tabelas com apenas duas colunas (id e dados únicos) e além disso, tenho diversas etapas de mesclas de consultas na minha tabela fato, o que deixa o processamento mais lento e o arquivo mais pesado.
E em uma das aulas do Leo sobre o Power Query, ele cita que devemos evitar ao máximo mesclar consultas na tabela fato.
Minha dúvida é, existe algum outro jeito de fazer esse processo já que não tenho os id's? Eu deveria criar as tabelas dimensão apenas com os tipos únicos e não criar uma chave única, para não ter que fazer a mescla de consultas?
Sinto que estou fazendo do jeito errado, mas estou um pouco sem norte.
Obrigado desde já
Link para o comentário
Compartilhar em outros sites
5 respostass a esta questão
Posts Recomendados
Faça login para comentar
Você vai ser capaz de deixar um comentário após fazer o login
Entrar Agora