Web scraping de dados referentes a indicadores relacionados à produção rural

Mohr, Guilherme Alan

dc.contributor.advisor	Lichtnow, Daniel
dc.creator	Mohr, Guilherme Alan
dc.date.accessioned	2023-07-28T12:19:11Z
dc.date.available	2023-07-28T12:19:11Z
dc.date.issued	2023-01-30
dc.date.submitted	2023
dc.identifier.uri	http://repositorio.ufsm.br/handle/1/29795
dc.description	Trabalho de conclusão de curso (graduação) - Universidade Federal de Santa Maria, Colégio Politécnico, Curso Superior de Tecnologia em Sistemas Para Internet, RS, 2023.	por
dc.description.abstract	This work proposes to develop a Database represented by one or more CSV files, containing data related to the agricultural context, so that it is possible to allow an analysis to be carried out and, if possible, to assist in decision-making about agricultural production. and carrying out future research. In addition, it is intended to make this Database created available on the GIPAG (Interdisciplinary Group of Georeferenced Agro-Food Research) page. This data will be obtained through the Web Scraping process, which is the Information Extraction process applied on the Web. Therefore, a theoretical review was carried out on the Web Scraping process and on tools that can be used to carry out this process and that are compatible with the Python Programming Language. The language was chosen to perform the Web Scraping process, as it is versatile and has several libraries that facilitate this process. Based on this review of search tools, the three most prominent were listed, namely, the following tools: Scrapy, Beautiful Soup and Selenium. About each tool, the main characteristics will be presented, along with two examples of data extraction with each tool. Next, the Web Scraping process in them will be presented studies of the portals and the systems that implement the. Later, some of the main data present in the developed database will be described, detailing their source and relevance. Finally, final considerations and ideas for the continuation of this work will be presented.	eng
dc.language	por	por
dc.publisher	Universidade Federal de Santa Maria	por
dc.rights	Acesso Aberto	por
dc.rights	Attribution-NonCommercial-NoDerivatives 4.0 International	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/	*
dc.subject	Base de dados	por
dc.subject	Produção agrícola	por
dc.subject	Web scraping	eng
dc.title	Web scraping de dados referentes a indicadores relacionados à produção rural	por
dc.title.alternative	Web scraping of data regarding indicators related to rural production	eng
dc.type	Trabalho de Conclusão de Curso de Graduação	por
dc.degree.local	Santa Maria, RS, Brasil.	por
dc.degree.graduation	Curso Superior de Tecnologia em Sistemas Para Internet	por
dc.description.resumo	Este trabalho propõe-se a desenvolver uma Base de Dados representada por um ou mais arquivos CSV, contendo dados relativos ao contexto agrícola, de modo que seja possível permitir a realização de uma análise, e se possível auxiliar na tomada de decisão acerca da produção agrícola e a realização de pesquisas futuras. Além disto, pretende-se disponibilizar esta Base de Dados criada na página do GIPAG (Grupo Interdisciplinar de Pesquisas Agroalimentares Georreferenciadas). Estes dados serão obtidos através do processo de Web Scraping, que é o processo de Extração de Informação aplicado na Web. Para tanto, foram realizadas revisão teórica sobre o processo de Web Scraping e sobre ferramentas que podem ser utilizadas para realizar este processo e que sejam compatíveis com a Linguagem de Programação Python. A linguagem foi escolhida para a realização do processo de Web Scraping, pois é versátil e possui diversas bibliotecas que facilitam a realização deste processo. Com base nesta revisão sobre as ferramentas de busca, elencou-se três com maior destaque, sendo elas, as seguintes ferramentas: Scrapy, Beautiful Soup e Selenium. Sobre cada ferramenta serão apresentadas as principais características, juntamente com dois exemplos de extração de dados com cada ferramenta. Em seguida, serão apresentados os estudos dos portais e os sistemas que implementam o processo de Web Scraping neles. Posteriormente serão descritos alguns dos principais dados presentes na base desenvolvida, detalhando sua fonte e relevância. Por fim, serão apresentadas as considerações finais e as ideias para a continuidade deste trabalho.	por
dc.publisher.country	Brasil	por
dc.publisher.initials	UFSM	por
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA	por
dc.publisher.unidade	Colégio Politécnico da UFSM	por

Arquivos deste item

Nome:: TCCG_SI_2023_MOHR_GUILHERME_AL ...
Tamanho:: 4.126Mb
Formato:: PDF
Descrição:: TCC de Graduação

Visualizar/Abrir

Nome:: license_rdf
Tamanho:: 805bytes
Formato:: application/rdf+xml

Visualizar/Abrir

Este item aparece na(s) seguinte(s) coleção(s)

TCC Tecnologia em Sistemas para Internet [17]

Mostrar registro simples

Exceto quando indicado o contrário, a licença deste item é descrito como Acesso Aberto