dc.contributor.advisor | Lichtnow, Daniel | |
dc.creator | Mohr, Guilherme Alan | |
dc.date.accessioned | 2023-07-28T12:19:11Z | |
dc.date.available | 2023-07-28T12:19:11Z | |
dc.date.issued | 2023-01-30 | |
dc.date.submitted | 2023 | |
dc.identifier.uri | http://repositorio.ufsm.br/handle/1/29795 | |
dc.description | Trabalho de conclusão de curso (graduação) - Universidade Federal de Santa Maria, Colégio Politécnico, Curso Superior de Tecnologia em Sistemas Para Internet, RS, 2023. | por |
dc.description.abstract | This work proposes to develop a Database represented by one or more CSV files, containing data related to the agricultural context, so that it is possible to allow an analysis to be carried out and, if possible, to assist in decision-making about agricultural production. and carrying out future research. In addition, it is intended to make this Database created available on the GIPAG (Interdisciplinary Group of Georeferenced Agro-Food Research) page. This data will be obtained through the Web Scraping process, which is the Information Extraction process applied on the Web. Therefore, a theoretical review was carried out on the Web Scraping process and on tools that can be used to carry out this process and that are compatible with the Python Programming Language. The language was chosen to perform the Web Scraping process, as it is versatile and has several libraries that facilitate this process. Based on this review of search tools, the three most prominent were listed, namely, the following tools: Scrapy, Beautiful Soup and Selenium. About each tool, the main characteristics will be presented, along with two examples of data extraction with each tool. Next, the Web Scraping process in them will be presented studies of the portals and the systems that implement the. Later, some of the main data present in the developed database will be described, detailing their source and relevance. Finally, final considerations and ideas for the continuation of this work will be presented. | eng |
dc.language | por | por |
dc.publisher | Universidade Federal de Santa Maria | por |
dc.rights | Acesso Aberto | por |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | Base de dados | por |
dc.subject | Produção agrícola | por |
dc.subject | Web scraping | eng |
dc.title | Web scraping de dados referentes a indicadores relacionados à produção rural | por |
dc.title.alternative | Web scraping of data regarding indicators related to rural production | eng |
dc.type | Trabalho de Conclusão de Curso de Graduação | por |
dc.degree.local | Santa Maria, RS, Brasil. | por |
dc.degree.graduation | Curso Superior de Tecnologia em Sistemas Para Internet | por |
dc.description.resumo | Este trabalho propõe-se a desenvolver uma Base de Dados representada por um ou mais arquivos CSV, contendo dados relativos ao contexto agrícola, de modo que seja possível permitir a realização de uma análise, e se possível auxiliar na tomada
de decisão acerca da produção agrícola e a realização de pesquisas futuras. Além disto, pretende-se disponibilizar esta Base de Dados criada na página do GIPAG (Grupo Interdisciplinar de Pesquisas Agroalimentares Georreferenciadas). Estes dados serão obtidos através do processo de Web Scraping, que é o processo de Extração de Informação aplicado na Web. Para tanto, foram realizadas revisão teórica sobre o processo de Web Scraping e sobre ferramentas que podem ser utilizadas para realizar este processo e que sejam compatíveis com a Linguagem de Programação Python. A linguagem foi escolhida para a realização do processo de Web Scraping, pois é versátil e possui diversas bibliotecas que facilitam a realização deste processo. Com base nesta revisão sobre as ferramentas de busca, elencou-se três com maior destaque, sendo elas, as seguintes ferramentas: Scrapy, Beautiful Soup e Selenium. Sobre cada ferramenta serão apresentadas as principais características, juntamente com dois exemplos de extração de dados com cada ferramenta. Em seguida, serão apresentados os estudos dos portais e os sistemas que implementam o processo de Web Scraping neles. Posteriormente serão descritos alguns dos principais dados presentes na base desenvolvida, detalhando sua fonte e relevância. Por fim, serão apresentadas as considerações finais e as
ideias para a continuidade deste trabalho. | por |
dc.publisher.country | Brasil | por |
dc.publisher.initials | UFSM | por |
dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA | por |
dc.publisher.unidade | Colégio Politécnico da UFSM | por |