Bom, estou com um problema bem específico e queria ajuda de vocês da área de ciência de dados.
Trabalho como engenheiro de processos industriais e atualmente tenho atuado junto a um software de simulação de uma usina de mineração. Acontece que esse software possui comunicação de dados via servidor OPC. Com isso, para importar os dados para o Power BI, eu preciso acoplar o simulador a uma bridge OPC-ODBC, armazenando os dados, com timestamp, no DB PostegreSQL. Sendo assim, do DB, eu consigo puxar os dados para o Power BI. Até aí, tudo certo...
O problema reside no fato de eu possuir centenas de tags, sendo que cada tag representa uma variável do simulador. Por exemplo: % de um componente no fluxo de alimentação da usina. Dessa forma, a tabela gerada no PostgreSQL é única, com uma coluna para cada variável. Segue uma imagem ilustrativa:
A minha dúvida é entender qual a melhor disposição desses dados. Seria uma tabela por fluxo de equipamentos da usina com uma coluna denominando esse fluxo e com as outras colunas com a % de cada componente? Ou seria melhor uma coluna com os componentes em linha com cada coluna representando um fluxo? Temos que lembrar da disposição do timestamp para cada tabela também...
De qualquer forma, preciso saber dessa disposição e também entender se consigo fazer essa alteração dentro do PowerQuery, uma vez que não consigo alterar a estrutura do servidor OPC, da bridge, etc...
Sei que é bem confuso, por isso me coloco a disposição para explicar de outra maneira caso alguém esteja disposto a me ajudar. Obrigado!
Pergunta
Belopes
Bom dia, pessoal, tudo certo?
Bom, estou com um problema bem específico e queria ajuda de vocês da área de ciência de dados.
Trabalho como engenheiro de processos industriais e atualmente tenho atuado junto a um software de simulação de uma usina de mineração. Acontece que esse software possui comunicação de dados via servidor OPC. Com isso, para importar os dados para o Power BI, eu preciso acoplar o simulador a uma bridge OPC-ODBC, armazenando os dados, com timestamp, no DB PostegreSQL. Sendo assim, do DB, eu consigo puxar os dados para o Power BI. Até aí, tudo certo...
O problema reside no fato de eu possuir centenas de tags, sendo que cada tag representa uma variável do simulador. Por exemplo: % de um componente no fluxo de alimentação da usina. Dessa forma, a tabela gerada no PostgreSQL é única, com uma coluna para cada variável. Segue uma imagem ilustrativa:
A minha dúvida é entender qual a melhor disposição desses dados. Seria uma tabela por fluxo de equipamentos da usina com uma coluna denominando esse fluxo e com as outras colunas com a % de cada componente? Ou seria melhor uma coluna com os componentes em linha com cada coluna representando um fluxo? Temos que lembrar da disposição do timestamp para cada tabela também...
De qualquer forma, preciso saber dessa disposição e também entender se consigo fazer essa alteração dentro do PowerQuery, uma vez que não consigo alterar a estrutura do servidor OPC, da bridge, etc...
Sei que é bem confuso, por isso me coloco a disposição para explicar de outra maneira caso alguém esteja disposto a me ajudar. Obrigado!
Link para o comentário
Compartilhar em outros sites
0 respostass a esta questão
Posts Recomendados
Faça login para comentar
Você vai ser capaz de deixar um comentário após fazer o login
Entrar Agora