Gestão de Dados Históricos em Bases de Dados de Grandes Dimensões

José Simão, Orlando Belo

Resumo


É muito provável que grande parte dos sistemas de informação tenha problemas de gestão de informação. Isto obriga à criação de novos tipos de técnicas de gestão de dados mais eficientes e específicas para cada caso, com capacidade para governar e assegurar o cumprimento das medidas de gestão definidas para os sistemas, e garantir o desempenho e a qualidade desejada. Neste trabalho, abordamos o problema da gestão de dados, e, através de uma solução baseada em técnicas de machine learning, tentamos perceber, aprender e classificar os dados contidos numa qualquer base de dados, de acordo com a sua relevância para os utilizadores. Conseguir identificar aquilo que é realmente importante para o utilizador e separar esta informação da restante, é uma excelente forma de diminuir a dimensão dos dados desnecessários num sistema e definir um modelo de gestão mais apropriado para os dados mantidos nos referidos sistemas.

Texto Completo:

PDF (English)

Referências


Ahmed, K., & Jesmin, T. (2014). Comparative Analysis of Data Mining Classification Algorithms in Type-2 Diabetes Prediction Data Using WEKA Approach. International Journal of Science and Engineering, 7(2). https://doi.org/10.12777/ijse.7.2.155-160

Candel, A., LeDell, E., Parmar, V., & Arora, A. (2017). Deep Learning with H2O - Booklet. H2O.ai, Inc.

Connolly, T. M., & Begg, C. E. (2005). Database Systems: A Practical Approach to Design, Implementation, and Management. Pearson Education.

Gantz, J., & Reinsel, D. (2012). THE DIGITAL UNIVERSE IN 2020: Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East. IDC.

Golfarelli, M., & Rizzi, S. (2009). Expressing OLAP Preferences. In M. Winslett (Ed.), Scientific and Statistical Database Management (Vol. 5566, pp. 83–91). Berlin, Heidelberg: Springer Berlin Heidelberg. Retrieved from http://link.springer.com/10.1007/978-3-642-02279-1_7

Grolinger, K., Higashino, W. A., Tiwari, A., & Capretz, M. A. (2013). Data Management in Cloud Environments: NoSQL and NewSQL Data Stores. J. Cloud Comput., 2(1), 49:1–49:24. https://doi.org/10.1186/2192-113X-2-22

Ioannidis, Y. E. (1996). Query optimization. ACM Computing Surveys, 28(1), 121–123. https://doi.org/10.1145/234313.234367

Kimball, R., & Ross, M. (2013). The data warehouse toolkit: the definitive guide to dimensional modeling (3rd edition). Indianapolis, Ind: Wiley.

LaBrie, R., & Ye, L. (2002). A Paradigm Shift In Database Optimization: From Indices To Aggregates. 5.

Marr, B. (2016). Big Data Overload: Why Most Companies Can’t Deal With The Data Explosion. Forbes. Retrieved from http://www.forbes.com/sites/bernardmarr/2016/04/28/big-data-overload-most-companies-cant-deal-with-the-data-explosion/#62164c203920

Rocha, D., & Belo, O. (2015). Integrating usage analysis on cube view selection - an alternative method. International Journal of Decision Support Systems, 1(2), 228. https://doi.org/10.1504/IJDSS.2015.067559

Sakr, S., Liu, A., Batista, D. M., & Alomari, M. (2011). A Survey of Large Scale Data Management Approaches in Cloud Environments. IEEE Communications Surveys Tutorials, 13(3), 311–336. https://doi.org/10.1109/SURV.2011.032211.00087

Zhang, S., Zhang, C., & Yang, Q. (2003). Data preparation for data mining. Applied Artificial Intelligence, 17(5–6), 375–381. https://doi.org/10.1080/713827180

Zhu, Y., Zhong, N., & Xiong, Y. (2009). Data Explosion, Data Nature and Dataology. In N. Zhong, K. Li, S. Lu, & L. Chen (Eds.), Brain Informatics: International Conference, BI 2009 Beijing, China, October 22-24, 2009 Proceedings (pp. 147–158). Berlin, Heidelberg: Springer Berlin Heidelberg. Retrieved from http://dx.doi.org/10.1007/978-3-642-04954-5_25




DOI: http://dx.doi.org/10.18803/capsi.v17.345-353

Apontamentos

  • Não há apontamentos.