Use este identificador para citar ou linkar para este item:
https://repositorio.cgu.gov.br/handle/1/42035| Título: | Geração de Regras de Identificação de Produtos em Descrições Textuais de Compras Apresentadas em Portais de Transparência Pública |
| Autor(es): | Paiva, Eduardo Soares de |
| Tipo: | Dissertação |
| Resumo: | Os portais de transparência pública vêm se constituindo em importantes canais de comunicação entre o governo e a sociedade. No entanto, nem sempre o formato das informações apresentadas nesses portais é o mais apropriado. Por exemplo, as descrições de compras em formato de texto dificultam a análise dessas compras, pois para se saber os produtos que estão sendo adquiridos é necessária uma leitura e interpretação de cada descrição de compra, o que é humanamente impossível, devido ao grande volume de dados apresentados. Dessa forma, o objetivo desse trabalho é fazer a identificação automática dos produtos que são especificados de forma textual nas descrições de compras. Logo, a questão de pesquisa dessa dissertação é: como identificar de forma automatizada os produtos a partir das especificações textuais que são usadas para caracterizá-los nas descrições dos gastos que são apresentados nos portais de transparência pública? Para isso, é proposto um processo de descoberta de conhecimento em dados textuais capaz de gerar regras que possibilitam a identificação de produtos a partir das descrições textuais de compras. A pesquisa foi realizada utilizando a metodologia CRISP-DM (Cross Industry Standard Proces for Data Mining) e sua avaliação foi dividida em duas partes: a primeira avalia as regras geradas, enquanto que a segunda verifica a qualidade dos resultados obtidos no processo de identificação de compras propriamente dito. Os estudos concluíram que o processo proposto apresentou resultados satisfatórios, porém ainda existem muitas outras possibilidades de melhorias que podem ser exploradas em trabalhos futuros. |
| Observações/Notas: | pg. 111 |
| Local de edição: | Rio de Janeiro (RJ) |
| Unidade Organizacional do Submetedor: | UNIDADE::SECRETARIA-EXECUTIVA (SE)::DIRETORIA DE GESTÃO INTERNA (DGI)::Coordenação-Geral de Gestão de Pessoas (COGEP) |
| Área temática: | Prevenção da Corrupção, Integridade e Transparência Pública |
| Assunto(s): | ASSUNTO::Prevenção da Corrupção::Transparência Pública |
| Palavras-chave: | Mineração de texto Tratamento de dados Processamento intensivo de dados |
| Data do documento: | Fev-2017 |
| URI: | https://basedeconhecimento.cgu.gov.br/handle/1/6343 |
| Detentor de Direitos Autorais: | Eduardo Soares de Paiva |
| Permissões e restrições de uso: | Licenças::Creative commons uso não comercial - não a obras derivadas (CC-by-nc-nd)::Licença que permite que outros façam download das obras licenciadas e as compartilhem, contanto que mencionem o autor, mas sem poder modificar a obra de nenhuma forma, nem utilizá-la para fins comerciais. |
| Aparece nas coleções: | Dissertações – Prevenção da Corrupção, Integridade e Transparência Pública |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| Tese_Mestrado_2017.pdf | 9.25 MB | Adobe PDF | ![]() Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.
