Use este identificador para citar ou linkar para este item:
https://repositorio.cgu.gov.br/handle/1/42035
Título: | Geração de Regras de Identificação de Produtos em Descrições Textuais de Compras Apresentadas em Portais de Transparência Pública |
Autor(es): | Paiva, Eduardo Soares de |
Tipo: | Dissertação |
Resumo: | Os portais de transparência pública vêm se constituindo em importantes canais de comunicação entre o governo e a sociedade. No entanto, nem sempre o formato das informações apresentadas nesses portais é o mais apropriado. Por exemplo, as descrições de compras em formato de texto dificultam a análise dessas compras, pois para se saber os produtos que estão sendo adquiridos é necessária uma leitura e interpretação de cada descrição de compra, o que é humanamente impossível, devido ao grande volume de dados apresentados. Dessa forma, o objetivo desse trabalho é fazer a identificação automática dos produtos que são especificados de forma textual nas descrições de compras. Logo, a questão de pesquisa dessa dissertação é: como identificar de forma automatizada os produtos a partir das especificações textuais que são usadas para caracterizá-los nas descrições dos gastos que são apresentados nos portais de transparência pública? Para isso, é proposto um processo de descoberta de conhecimento em dados textuais capaz de gerar regras que possibilitam a identificação de produtos a partir das descrições textuais de compras. A pesquisa foi realizada utilizando a metodologia CRISP-DM (Cross Industry Standard Proces for Data Mining) e sua avaliação foi dividida em duas partes: a primeira avalia as regras geradas, enquanto que a segunda verifica a qualidade dos resultados obtidos no processo de identificação de compras propriamente dito. Os estudos concluíram que o processo proposto apresentou resultados satisfatórios, porém ainda existem muitas outras possibilidades de melhorias que podem ser exploradas em trabalhos futuros. |
Observações/Notas: | pg. 111 |
Local de edição: | Rio de Janeiro (RJ) |
Unidade Organizacional do Submetedor: | UNIDADE::SECRETARIA-EXECUTIVA (SE)::DIRETORIA DE GESTÃO INTERNA (DGI)::Coordenação-Geral de Gestão de Pessoas (COGEP) |
Área temática: | Prevenção da Corrupção, Integridade e Transparência Pública |
Assunto(s): | ASSUNTO::Prevenção da Corrupção::Transparência Pública |
Palavras-chave: | Mineração de texto Tratamento de dados Processamento intensivo de dados |
Data do documento: | Fev-2017 |
URI: | https://basedeconhecimento.cgu.gov.br/handle/1/6343 |
Detentor de Direitos Autorais: | Eduardo Soares de Paiva |
Permissões e restrições de uso: | Licenças::Creative commons uso não comercial - não a obras derivadas (CC-by-nc-nd)::Licença que permite que outros façam download das obras licenciadas e as compartilhem, contanto que mencionem o autor, mas sem poder modificar a obra de nenhuma forma, nem utilizá-la para fins comerciais. |
Aparece nas coleções: | Dissertações – Prevenção da Corrupção, Integridade e Transparência Pública |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Tese_Mestrado_2017.pdf | 9.25 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.