Estou cursando a Trilha Champion e praticando os conteúdos em situações e bases reais da empresa que trabalho. Contudo tenho encontrado muita resistência e dificuldade para acessar dados e relatórios, pois existe uma grande preocupação com o sigilo das informações e pouca disposição em discutir novas ideias e eventuais otimizações.
As bases ao qual possuo acesso só podem ser exportadas em formato .pdf e devido a tabulação e configuração do layout paginado o processo de ETL é bem trabalhoso.
Preciso de auxílio para resolver a seguinte questão:
Estou trabalhando em uma base com cerca de 8 mil linhas e verifiquei uma “perda” valores após aplicadas algumas etapas de tratamento. O motivo é que em função da tabulação algumas linhas acabam sendo “agrupadas” e removidas durante o processo de limpeza da base.
Pergunta
Anderson Campos
Boa noite!
Estou cursando a Trilha Champion e praticando os conteúdos em situações e bases reais da empresa que trabalho. Contudo tenho encontrado muita resistência e dificuldade para acessar dados e relatórios, pois existe uma grande preocupação com o sigilo das informações e pouca disposição em discutir novas ideias e eventuais otimizações.
As bases ao qual possuo acesso só podem ser exportadas em formato .pdf e devido a tabulação e configuração do layout paginado o processo de ETL é bem trabalhoso.
Preciso de auxílio para resolver a seguinte questão:
Estou trabalhando em uma base com cerca de 8 mil linhas e verifiquei uma “perda” valores após aplicadas algumas etapas de tratamento. O motivo é que em função da tabulação algumas linhas acabam sendo “agrupadas” e removidas durante o processo de limpeza da base.
Problema:
Solução:
Por favor, solicito auxílio dos especialistas rs.
Teste.xlsx
Link para o comentário
Compartilhar em outros sites
2 respostass a esta questão
Posts Recomendados
Faça login para comentar
Você vai ser capaz de deixar um comentário após fazer o login
Entrar Agora