Classification Based on Rules for the Study of Cotton Productivity in the State of Mato Grosso
DOI:
https://doi.org/10.22456/2175-2745.108126Keywords:
Cotton productivity, Data mining, Classification based on rules, Machine learningAbstract
The advance of cotton farming in the Brazilian savannah boosted and made possible a highly technified, efficient and profitable production, elevating the country from the condition of cotton fiber importer in the 70s to one of the main exporters so far. Despite the increasing contribution of technologies such as transgenic cultivars, machines, inputs and more efficient data management, in recent years there has been a stagnation of cotton productivity in the State of Mato Grosso (MT). Data Mining (MD) techniques offer an excellent opportunity to assess this problem. Through the rules-based classification applied to a real database (BD) of cotton production in MT, factors were identified that were affecting and consequently limiting the increase in productivity. In the pre-processing of the data, we perform the attributes, selection, transformation and identification of outliers. Numerical attributes were discretized using automatic techniques: Kononenko (KO), Better Encoding (BE) and combination: KO + BE. In modeling the rule algorithms used were PART and JRip, both implemented in the WEKA tool. Performance was assessed using statistical metrics: accuracy, recall, cost and their combination using the I_FC index (created by the authors). Results showed better performance for the PART classifier, with discretization by the KO + BE technique, followed by binary conversion. The analysis of the rules made it possible to identify the attributes that most impact productivity. This article is an excerpt from an ICMC/USP Professional Master's Dissertation in Science carried out in São Carlos-SP/BR.Downloads
References
WITTEN, I.; FRANK, E. Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations. Burlington / Massachusetts: Elsevier, 2009.
ABRAPA. Brasil finaliza colheita de uma nova safra recorde de algodão. 2020. Disponível em: 〈https://www.abrapa.com.br/Paginas/Not%C3%ADcias%20Abrapa.aspx?noticia=522〉. Acesso em: 25 de abr. de 2021.
GUIAJEANSWEAR. Mato Grosso lidera produção de algodão no Brasil. 2019. Disponível em: 〈https://guiajeanswear.com.br/noticias/mato-grosso-lidera-producao-de-algodao-no-brasil-veja-ranking/〉. Acesso em: 25 de abr. de 2021.
NOTICIASAGRICOLAS. Câmara Setorial do Algodão e Derivados (CSAD) aponta produçao e exportaçoes recordes. 2019. Disponível em: 〈https://www.noticiasagricolas.com.br/noticias/algodao/238097-camara-setorial-do-algodao-e-derivados-csad-aponta-producao-e-exportacoes-recordes.html#.YIXr6pBKg2w〉. Acesso em: 25 de abr. de 2021.
ABRAPA. Algodão no Brasil. 2021. Dispon ́ıvel em: 〈https://www.abrapa.com.br/Paginas/dados/algodao-no-brasil.aspx〉. Acesso em: 25 de abr. de 2021.
EMBRAPA. Série Desafios do Agroneg ́ocio Brasileiro (NT3) – Produto: Algodão – Parte 01: Caracterização e Desafios Tecnológicos. 2019. Disponível em: 〈https://www.alice.cnptia.embrapa.br/alice/bitstream/doc/1109655/1/SerieDesafiosAgronegocioBrasileiroNT3Algodao〉. Acesso em: 25 de abr. de 2021.
CULTIVAR, R. Medidas de manejo contra nematoides em algod ̃ao. 2020. Dispon ́ıvel em: 〈https://www.grupocultivar.com.br/noticias/medidas-de-manejo-contra-nematoides-em-algodao#:∼:text=S%C3%A3o%20v%C3%A1rios%20os%20fatores%20que,causando%20a%20diminui%C3%A7%C3%A3o%20da%20produtividade.〉Acesso em: 27 de abr. de 2021.
EMBRAPA. Algodão de alta produtividade e qualidade superior de fibra ́e apresentado na Tecnoshow Comigo. 2018. Disponível em: 〈https://www.embrapa.br/busca-de-noticias/-/noticia/33250842/algodao-de-alta-produtividade-e-qualidade-superior-de-fibra-e-apresentado-na-tecnoshow-comigo〉. Acesso em: 09 de abr. de 2018.
PAUTA, E. em. Como a Mineração de Dados pode auxiliar o agronegócio? 2017. Dispon ́ıvel em: 〈https://excelenciaempauta.com.br/mineracao-de-dados-auxilia-o-agronegocio/#:∼:text=Esse%20processo%20se%20denomina%20data,a%20agroind%C3%BAstria%2C%20entre%20outros%20aspectos.〉Acesso em: 25 de abr. de 2021.
NEELAVENI, N.; RAJESWARI, S. Data mining in agriculture - a survey. International Journal of Modern Computer Science — Revista da Faculdade de Serviço Social da UERJ, Rio de Janeiro, v. 4, n. 4, p. 104–107, 2016. ISSN 2320-7868. Disponível em: 〈http://www.ijmcs.info/current issue/IJMCS160835.pdf〉. Acesso em: 28 nov. 2018.
AHAMED, A. T. M. S. et al. Applying data mining techniques to predict annual yield of major crops and recommend planting different crops in different districts in bangladesh. International Conference on Software Engineering, Artificial Intelligence, Networking and Parallel/Distributed Computing (SNPD), IEEE/ACIS 16th, Takamatsu, Japan, p. 1–6, 2015. Disponível em: 〈http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=7176185&isnumber=7176160〉. Acesso em: 03 de jul. de 2018.
VRIESMANN, L. M. et al. Análise de resultados obtidos por técnicas de inteligência artificial na mineração de dados de produtividade do solo. Revista Brasileira de Agrocomputação, Ponta Grossa-PR, DEINFO/UEPG, v. 2, n. 1, p. 11–18, 2004. Dispon ́ıvel em: 〈http://www.agrocomputacao.deinfo.uepg.br/junho 2004/Arquivos/RBAC Artigo 02.pdf〉. Acesso em: 03 de jul. de 2018.
GARCIA, E.; JÚNIOR, L. C. Classificação de fatores que mais impactam a produtividade da cana-de-açúcar usando mineração de dados. XSBIAGRO - X Congresso Brasileiro de Agroinformática, 2015. Dispon ́ıvel em:〈http://eventos.uepg.br/sbiagro/2015/anais/SBIAgro2015/pdf resumos/16/16 ederson garcia 73.pdf〉. Acesso em: 30 de nov. de 2017.
SILVA, C. F.; RODRIGUES, C. T.; MONTEIRO, M. V. B. Inteligência artificial - uso de regras de associação para descoberta de conhecimento na produtividade de ac ̧a ́ı no estado do amapá. SULCOMP - Congresso Sul Brasileiro de Computação, 2010. ISSN 2359-2656. Dispon ́ıvel em: 〈http://periodicos.unesc.net/sulcomp/article/view/297/304〉. Acesso em: 30 de nov. de 2018.
GANDHI, N.; ARMSTRONG, L. A review of the application of data mining techniques for decision making in agriculture. 2016a. Disponível em: 〈https://ieeexplore.ieee.org/document/7917925/〉. Acesso em: 30 de nov. de 2018.
GANDHI, N.; ARMSTRONG, L. Rice Crop Yield Forecasting of Tropical Wet and Dry Climatic Zone of India Using Data Mining Techniques. 2016b. 357-363 p. Acesso em: 30 de nov. de 2018.
DEY, U. K.; MASUD, A. H.; UDDIN, M. N. Rice yield prediction model using data mining. ECCE: International Conference on Electrical, Computer and Communication Engineering, Cox’s Bazar, p. 321–326, 2017. Dispon ́ıvel em:〈http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=7912925&isnumber=7912861〉. Acesso em: 30 de nov. de 2018.
DELERCE, S. et al. Assessing weather-yield relationships in rice at local scale using data mining approaches. PLoS ONE 11(8):e0161620. doi:10.1371/journal.pone.0161620, August 25, 2016, 2016. Dispon ́ıvel em: 〈http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0161620〉. Acesso em: 30 de nov. de 2018.
HAMMER, R. G. Modelagem da Produtividade da Cultura da cana-de-açúcar por meio do uso de técnicas de mineração de dados. Dissertação (Mestrado) — Universidade de São Paulo - Campus São Carlos, São Carlos-SP, 2016.
PATEL, H.; PATEL, D. A brief survey of data mining techniques applied to agricultural data. International Journal of Computer Applications, v. 95, n. 9, p. 6–8, 2014. ISSN 0975 – 8887. Dispon ́ıvel em: 〈https://www.researchgate.net/publication/269669148 A Brief survey of Data Mining Techniques Applied to Agricultural Data〉.
Acesso em: 03 de jul. de 2018.
AGRAWAL, R.; IMIELINSKI, T.; SWAMI, A. Mining association rules between sets of items in large databases. ACM Sigmod Conference, IBM Almaden Research Center / 650 Harry Road, San Jose, CA 95120, EUA, 1993. Dispon ́ıvel em:〈http://www.rakesh.agrawal-family.com/papers/sigmod93assoc.pdf〉. Acesso em: 27 de abr. de 2021.
DAMACENO, L. K. Introduc ̧ ̃ao a Machine Learning utilizando o Weka. 2017. Disponível em: 〈https://medium.com/cwi-software/introdu%C3%A7%C3%A3o-a-machine-learning-utilizando-o-weka-c38388514c40〉. Acesso em: 28 de abr. de 2021.
GARCIA, M. Weka Data Mining – Software Open Source em Java. 2020. Disponível em: 〈https://www.cetax.com.br/blog/weka-data-mining-open-source/〉. Acesso em: 28 de abr. de 2021.
QUINLAN, R. C4.5: Programs for machine learning. Kluwer Academic Publishers, Boston. Manufactured in The Netherlands, p. 235–240, 1993. Disponível em: 〈http://server3.eca.ir/isi/forum/Programs%20for%20Machine%20Learning.pdf〉. Acesso em: 30 de nov. de 2018.
COHEN, W. W. Fast effective rule induction. Machine Learning Proceedings 1995: Proceedings of the Twelfth International Conference on Machine Learning, Tahoe City, California, July 9–12, 1995, p. 115–123, 1995. Disponível em:〈http://www.cs.utsa.edu/∼bylander/cs6243/cohen95ripper.pdf〉. Acesso em: 30 de nov. de 2018.
FURNKRANZ, J.; WIDMER, G. Incremental reduced error pruning. Machine Learning Proceedings 1994: Proceedings of the Eleventh International Conference, Machine Learning Proceedings, Rutgers University, New Brunswick, NJ, July 10–13, 1994, p. 70–77, 1994. Dispon ́ıvel em: 〈https://www.sciencedirect.com/science/article/pii/B9781558603356500179〉. Acesso em: 03 de jul. de 2018.
MELO, I. R. S. et al. Avaliação do desempenho do algoritmo jrip na classificação do diagnóstico de doenc ̧as card ́ıacas. IV Congresso Nacional de Pesquisa e Ensino em Ciências - CONAPESC, Campina Grande - PB de 22 a 24 de agosto, 2019. ISSN 2525-6696. Disponível em: 〈http://editorarealize.com.br/artigo/visualizar/56596〉. Acesso em: 26 de abr. de 2021.
SHANNON, C. E. A mathematical theory of communication. In: . July, October, 1948, 1948. v. 27, p. 379–423, 623–656. Dispon ́ıvel em: 〈http://math.harvard.edu/∼ctm/home/text/others/shannon/entropy/entropy.pdf〉. Acesso em: 27 de set. de 2018.
PAVIOTTI, J. R. Considerações sobre o conceito de entropia na teoria da informação. 118 p. Dissertação (Mestrado) — Universidade Estadual de Campinas/Faculdade de Tecnologia, Limeira-SP, 2019.
HOSOKAWA, E. O. Técnica de ́Arvore de Decisão em Mineração de Dados. 2011. Dispon ́ıvel em:〈http://www.fatecsp.br/dti/tcc/tcc0003.pdf〉. Acesso em: 28 de out. de 2018.
GRUNWALD, P. The Minimum Description Length Principle. Cambridge, MA: MIT Press (14 marc ̧o 2016), 2016.
RISSANEN, J. Modeling by the shortest data description. Automatica, v. 14, p. 465–471, 1978. Disponível em:〈https://msol.people.uic.edu/ECE531/papers/Modeling%20By%20Shortest%20Data%20Description.pdf〉. Acesso em: 26 de abr. de 2021.
GRUNWALD, P. Introducing the minimum description length principle. Amsterdam, v. 2, p. 20, 2007. ISSN 9780262256292. Disponível em: 〈file:///C:/Users/Lenovo/Downloads/The Minimum Description Length Principle.pdf〉. Acesso em: 26 de abr. de 2021.
GRUNWALD, P.; ROOS, T. Minimum description length revisited. Cornell University - arXiv.org ¿ stat ¿ arXiv: 1908.08484v2, v. 2, p. 38, 2019. Dispon ́ıvel em:〈https://arxiv.org/abs/1908.08484〉. Acesso em: 26 de abr. de 2021.
RODRIGUES, E. S. C. Teoria da informação e adaptatividade na modelagem de distribuição de espécies. 137 p. Tese (Doutorado) — Escola Politécnica da Universidade de São Paulo, S ̃ao Paulo, 2012.
FAYYAD, U. M.; IRANI, K. B. Multi-interval discretization of continuous-valued attributes for classification learning. IJCAI, 1993. Disponível em: 〈https://www.semanticscholar.org/paper/Multi-Interval-Discretization-of-Continuous-Valued-Fayyad-Irani/1dc53b91327cab503acc0ca5afb9155882b717a5〉. Acesso em: 27 de out. de 2018.
BARBOSA, A. A. V. Entropia de Shannon e propriedades topológicas de redes funcionais do cérebro humano sob efeito de Ayahuasca. Tese (Doutorado) — Universidade Federal do Rio Grande do Norte, 2015. Dispon ́ıvel em:〈https://repositorio.ufrn.br/jspui/handle/123456789/21549〉. Acesso em: 02 de nov. de 2018.
OTTERBACH, J. MDLP and Conditional Inference - Strategies to prevent Decision Trees from overfitting. 2016. Disponível em: 〈http://jotterbach.github.io/2016/12/10/RecursivePartitioning/〉. Acesso em: 07 de nov. de 2018.
FAYYAD, U. M. On the Induction of Decision Trees for Multiple Concept Learning (Machine Learning). Digitalizado em 25 mar. 2011, 263. p. Tese (Doutorado) — Universidade de Michigan, 1991. Dispon ́ıvel em:〈https://dl.acm.org/citation.cfm?id=144532〉. Acesso em: 30 de nov. de 2018.
KONONENKO, I. On biases in estimating multi-valued attributes. IJCAI’95 Proceedings of the 14th international joint conference on Artificial intelligence, Morgan Kaufmann Publishers Inc. San Francisco, CA, USA ©1995, Montreal, Quebec, Canada — August 20 - 25, 1995, v. 2, p. 1034–1040, 1995. Dispon ́ıvel em: 〈https://dl.acm.org/citation.cfm?id=1643034〉. Acesso em: 03 de ago. de 2018.
ISMAIL, M. K.; CIESIELSKI, V. n empirical investigation of the impact of discretization on common data distributions. Design and application of hybrid intelligent systems, IOS Press Amsterdam, The Netherlands, The Netherlands ©2003, Department of Computer Science RMIT University- Melbourne, VIC 3001, Australia, p. 692–701, 2003. Dispon ́ıvel em:〈https://dl.acm.org/citation.cfm?id=998117〉. Acesso em: 04 de set. de 2018.
KIRA, K.; RENDELL, L. A. A practical approach to feature selection. ML92 Proceedings of the ninth international workshop on Machine learning, Aberdeen, Scotland, United Kingdom, p. 249–256, 1992. Dispon ́ıvel em:〈http://sci2s.ugr.es/keel/pdf/algorithm/congreso/kira1992.pdf〉. Acesso em: 03 de ago. de 2018.
PETER, C.; BEALE, R. Affect and Emotion in Human-Computer Interaction: From Theory to Applications. Springer, Berlin, Heidelberg, 1ª edição: Alta Books, 2008.
GALBIERI, R. et al. Nematoides fitoparasitas do algodoeiro nos cerrados brasileiros: Biologia e medidas de controle. Cuiabá (MT): Boletim de P&D - nº3, maio, 2016.
CARVALHO, A. C. P. L. F. de et al. Inteligência Artificial: Uma abordagem de Aprendizagem de Máquina. Rio de Janeiro: LTC, 2021.
REZENDE, S. O. Sistemas Inteligentes: fundamentos e aplicações. Barueri-SP: MANOLE, 2003.
GARCIA, S. et al. A survey of discretization techniques: Taxonomy and empirical analysis in supervised learning. IEEE Transactions on Knowledge and Data Engineering, v. 25, n. 4, p. 734–750, 2013. ISSN 1041-4347. Dispon ́ıvel em:〈http://doi.ieeecomputersociety.org/10.1109/TKDE.2012.35〉. Acesso em: 03 de ago. de 2018.
HAN, J.; KAMBER, M. Data Mining: Concepts and Techniques. San Francisco-CA/EUA: Morgan Kaufmann, 2006.
FERREIRA, D. F. Estatística Básica. [S.l.]: UFLA, 2009. 663 p.
PRATI, R. C.; BATISTA, G. E. A. P. A.; MONARD, M. C. Curvas roc para avaliação de classificadores. 2006. Disponível em: 〈http://conteudo.icmc.usp.br/pessoas/gbatista/files/ieee la2008.pdf〉. Acesso em: 04 de set. de 2018.
MEDRI, W. Análise explorat ́oria de dados. Londrina-PR, 2011.
ASMUS, G. L.; GALBIERI, R. Densidade populacional e distribuic ̧ ̃ao espacial de meloidogyne incognita e rotylenchulus reniformis em algodoeiro em sistema de plantio adensado. Editado por Cl ́audia R. Dias-Arieira, Instituto Mato-Grossense do Algod ̃ao, Av. Rubens de Mendonça, 157, Sala 100, 78008-000 Cuiabá (MT) Brasil, v. 37(3-4), p. 6, 2013. Dispon ́ıvel em:〈https://ainfo.cnptia.embrapa.br/digital/bitstream/item/98644/1/Guilherme-Nematologia-Brasileira-2013.pdf〉. Acesso em: 27
de jul. de 2020.
LOPES, A. S. Solos sob cerrados: características, propriedades e manejo. 2. ed. Piracicaba: Associação Brasileira para Pesquisa da Potassa e do Fosfato, 1984. 162 p.
MARSCHNER, H. Mineral Nutrition of Higher Plants. [S.l.: s.n.], 1995. 889 p.
ROCHESTER, I. J. Nutrient uptake and export from an australian cotton field. Nutrient Cycling in Agroecosystems, Springer Holanda, v. 77, n. 3, p. 213–223, 2007. ISSN 1385-1314. Dispon ́ıvel em: 〈https://www.infona.pl/resource/bwmeta1.element.springer-7e28f543-80d1-350d-b510-abf17c09ba88〉. Acesso em: 25 de jun. de 2018.
CARVALHO, M. S. Nutrição e Adubação do Algodoeiro com Micronutrientes. Campina Grande, PB, 2007. 1-17 p.
GALBIERI, R. et al. ́Areas de produção de algodão em Mato Grosso: nematoides, murcha de fusarium, sistemas de cultivo, fertilidade e f ́ısica de solo. Embrapa Agropecuária Oeste, 2014. 1-16 p.
FAGERIA, N. K.; STONE, L. F. Produtividade de feij ̃ao no sistema plantio direto com aplicação de calcário e zinco. Pesquisa Agropecu ́aria Brasileira (PAB), Embrapa Sede, Secretaria de Pesquisa e Desenvolvimento (SPD), Brasil, Embrapa Arroz e Feij ̃ao, Santo Antônio de Goi ́as, GO, v. 39, n. 1, p. 73–78, 2004. ISSN 1678-3921. Disponível em:〈https://www.scielo.br/pdf/pab/v39n1/19587.pdf〉. Acesso em: 12 de set. de 2018.
HERNANI L. C.; SALTON, J. C. Manejo e conservação do solo. Embrapa Agropecuária Oeste, 1998. 26-50 p.
CRUZ, J. C. et al. Plantio direto e sustentabilidade do sistema agrícola. Informe Agropecu ́ario, Belo Horizonte, v. 22, n. 208, p. 13–24, 2001. ISSN 0100-3364. Dispon ́ıvel em: 〈file:///C:/Users/Lenovo/Downloads/Plantio-direto-3.pdf〉. Acesso em: 10 de nov. de 2018.
EMBRAPA. Plantio direto do algodoeiro aumenta estoque de carbono no solo em 20%. 2019. Dispon ́ıvel em:〈https://www.embrapa.br/busca-de-noticias/-/noticia/45923956/plantio-direto-do-algodoeiro-aumenta-estoque-de-carbono-no-solo-em-20〉. Acesso em: 23 de mar. de 2019.
INOVADORES, A. Fusarium e nematoides: qual a sua relação? 2019. Disponível em: 〈https://agro.genica.com.br/2019/11/28/fusarium-e-nematoides-qual-a-sua-relacao/〉. Acesso em: 28 de abr. de 2021.
NICOL, J. M. et al. Current nematode threats to world agriculture. In: . 1. ed. [S.l.]: Springer Holanda, 2011. cap. 2, p. 21–43.
ASMUS, G. L.; GALBIERI, R. Principais esp ́ecies de nematoides do algodoeiro no brasil. In: . 3. ed. editores t ́ecnicos: Rafael Galbieri e Jean Louis Belot - Cuiab ́a (MT): Boletim de P&D, 2016. cap. 1, p. 11–36.
BALDIN, E. L. L. et al. O uso de plantas transgênicas resistentes a insetos no brasil. In: Inovações em manejo fitossanitário. Botucatu - SP — Brasil: FEPAF, 2017. p. 62–79.
AGRONOMICAS, B. P. Algodão Bt. 2020. Dispon ́ıvel em: 〈https://boaspraticasagronomicas.com.br/noticias/algodao-bt/〉. Acesso em: 28 de abr. de 2021.