REVISTACIENTIFICAMULTIDISCIPLINARNUCLEODOCONHECIMENTO
Pesquisar nos:
Filter by Categorias
Administração
Administração Naval
Agronomia
Arquitetura
Arte
Biologia
Ciência da Computação
Ciência da Religião
Ciências Aeronáuticas
Ciências Sociais
Comunicação
Contabilidade
Educação
Educação Física
Engenharia Agrícola
Engenharia Ambiental
Engenharia Civil
Engenharia da Computação
Engenharia de Produção
Engenharia Elétrica
Engenharia Mecânica
Engenharia Química
Ética
Filosofia
Física
Gastronomia
Geografia
História
Lei
Letras
Literatura
Marketing
Matemática
Meio Ambiente
Meteorologia
Nutrição
Odontologia
Pedagogia
Psicologia
Química
Saúde
Sem categoria
Sociologia
Tecnologia
Teologia
Turismo
Veterinária
Zootecnia
Pesquisar por:
Selecionar todos
Autores
Palavras-Chave
Comentários
Anexos / Arquivos

Metodologias sobre aprendizagem de ontologias: uma revisão sistemática de literatura

RC: 154665
436
5/5 - (10 votos)
DOI: 10.32749/nucleodoconhecimento.com.br/tecnologia/aprendizagem-de-ontologias

CONTEÚDO

ARTIGO DE REVISÃO 

LOPES, Patrícia, LIMA, Gercina Ângela de 

LOPES, Patrícia. LIMA, Gercina Ângela de. Metodologias sobre aprendizagem de ontologias: uma revisão sistemática de literatura. Revista Científica Multidisciplinar Núcleo do Conhecimento. Ano 09, Ed. 11, Vol. 10, pp. 139-171. Novembro de 2024. ISSN: 2448-0959, Link de acesso: https://www.nucleodoconhecimento.com.br/tecnologia/aprendizagem-de-ontologias, DOI: 10.32749/nucleodoconhecimento.com.br/tecnologia/aprendizagem-de-ontologias

RESUMO

Contextualização: Ontologias vêm ganhando popularidade e reconhecimento em diferentes contextos. Entretanto, com o aumento exponencial de dados não estruturados na Web, o processo de construção de ontologias tornou-se complexo, demorado e dispendioso. Surgem, então, as abordagens de geração automática ou semiautomática de ontologias. Dado o contexto atual de transformação digital pelo qual passam diversos países, incluindo o Brasil, entende-se que as pesquisas sobre a automatização da geração de ontologias podem contribuir para a exploração e melhor aplicação desse tipo de Sistema de Organização do Conhecimento (SOC) no âmbito do governo eletrônico. Objetivo: Este estudo apresenta uma Revisão Sistemática da Literatura (RSL) sobre a geração automática e semiautomática de ontologias, com o objetivo de evidenciar o estágio atual da pesquisa nessa área. Métodos: Adotou-se o método proposto por Kitchenham (2004), que descreve procedimentos para realizar revisões sistemáticas de literatura, considerando a formulação de perguntas de pesquisa, o desenvolvimento de um protocolo, a identificação e seleção de estudos, avaliação de qualidade, extração e síntese de dados e relato dos resultados. Resultados: A revisão revelou uma diversidade significativa de abordagens e metodologias sendo exploradas para a geração automática e semiautomática de ontologias. No entanto muitas metodologias ainda enfrentam desafios, principalmente no que diz respeito ao detalhamento de fases e etapas que sejam facilmente replicáveis. Conclusões: Futuras pesquisas devem focar na criação de metodologias mais detalhadas e sistemáticas para aumentar a replicabilidade e a aplicação prática. As descobertas deste estudo podem inspirar investigações adicionais e estimular a implementação das ontologias no âmbito no governo eletrônico, com vistas a aprimorar a eficiência, a transparência e a acessibilidade dos serviços públicos digitais.

Palavras-chave: Ciência da Informação, Ontologias, Aprendizagem de ontologias, Governo eletrônico.

1. INTRODUÇÃO

A Ciência da Informação tem passado por transformações significativas, especialmente na organização e representação do conhecimento, em que as ontologias emergem como ferramentas cruciais para a estruturação e interpretação de informações complexas. Contudo a explosão de dados não estruturados na Web impõe desafios ao processo tradicional de construção de ontologias, tornando-o complexo, demorado e dispendioso.

Apesar do crescente interesse na construção de ontologias, sua utilização em larga escala ainda é limitada devido às demandas consideráveis de tempo, custo e recursos envolvidos no processo. Para contribuir com o avanço da investigação nesse campo, diversas pesquisas têm se concentrado na automatização de diferentes etapas da construção de ontologias.

Este estudo apresenta uma Revisão Sistemática da Literatura (RSL) sobre a geração automática e semiautomática de ontologias[3], área conhecida como aprendizagem de ontologias ou ontology learning, buscando agregar conhecimento sobre as abordagens, metodologias e ferramentas mais recentes. A revisão de artigos científicos visa identificar metodologias, etapas, vantagens e lacunas apontadas pelos autores, bem como os principais resultados. Compreender a dinâmica e o estado atual da pesquisa nesse campo do conhecimento contribuirá para o desenvolvimento e o aprimoramento dessa área crucial na representação do conhecimento.

Para a organização e gestão das referências, utilizou-se o software Mendeley, enquanto o Atlas TI foi empregado para a análise qualitativa dos estudos selecionados. A pesquisa visou identificar trabalhos que aplicaram métodos de aprendizagem de ontologias entre 2018 e 2023, abordando questões como a identificação de metodologias específicas, etapas envolvidas, vantagens, diferenciais e lacunas existentes. As bases de dados consultadas incluem ACM Digital Library, IEEE Xplore Digital Library, Scopus Preview e Web of Science, utilizando termos de busca em inglês e português para garantir a abrangência e a relevância dos resultados.

O protocolo da RSL definiu critérios de inclusão e exclusão para assegurar a qualidade e a pertinência dos estudos analisados. Foram considerados apenas trabalhos com relação direta à temática de aprendizagem de ontologias, disponíveis integralmente e publicados em inglês, português ou espanhol. A exclusão de duplicatas e a filtragem de trabalhos irrelevantes resultaram em 183 textos, reduzidos a 170 após a verificação de disponibilidade do texto completo. A análise final concentrou-se em 22 estudos, selecionados pela sua relevância e aderência aos critérios estabelecidos.

Este estudo contextualiza a importância da geração automática de ontologias, destacando sua aplicação prática e potencial de inovação no campo do governo eletrônico. A revisão detalhada das metodologias existentes permite identificar avanços e desafios, contribuindo para o desenvolvimento de abordagens mais eficazes e robustas. A clareza metodológica e a replicabilidade são aspectos fundamentais para a evolução dessa área, proporcionando uma base sólida para futuras pesquisas e implementações práticas. O artigo está organizado da seguinte forma: esta seção 1, que é introdutória; a seção 2, que detalha os procedimentos metodológicos adotados na RSL; a seção 3, que apresenta os resultados e discute as principais metodologias identificadas, incluindo diferenciais, lacunas e resultados; e a seção 4, que traz as considerações finais e sugestões para pesquisas futuras.

2. PROCEDIMENTOS METODOLÓGICOS ADOTADOS NA REVISÃO

Os procedimentos metodológicos para a Revisão Sistemática da Literatura foram respaldados no método proposto por Kitchenham (2004). Para organização e gestão das referências, foi utilizado o software Mendeley. O software Atlas TI foi utilizado para análise qualitativa do material selecionado. As pesquisas referenciadas foram selecionadas considerando maior aproximação dos resultados apresentados com a temática desta pesquisa e estão organizadas nas categorias de análise previamente identificadas no protocolo da revisão, descrito no Quadro 1, a seguir. 

Quadro 1 – Resumo Protocolo da Revisão Sistemática

Fonte: Elaborado pelas autoras (2024).

Partindo-se das perguntas de pesquisa, seguiu-se para o levantamento dos termos de busca, considerando inicialmente as variações nos idiomas inglês e português, conforme disposto no Quadro 2, a seguir.

Quadro 2 – Termos de busca

Fonte: Elaborado pelas autoras (2024).

Após a definição dos termos de busca, considerando a aderência à temática da pesquisa, foi realizado o levantamento das bases de dados, chegando-se às seguintes: ACM Digital Library; IEEE Xplore Digital Library; Scopus Preview e Web of Science. Inicialmente, executaram-se as expressões de busca indicadas no Quadro 3 em cada uma das bases de dados. A partir da lista de estudos retornados, os resultados foram exportados em formato RIS para importação na ferramenta Mendeley. 

Quadro 3 – Strings de busca

Fonte: elaborado pelas autoras (2024).

Na primeira etapa de seleção dos textos, foram excluídas as duplicatas, resultando-se em 183 textos. Considerando a exclusão dos trabalhos que não disponibilizavam o texto completo, chegou-se a um total de 170 textos. Essas etapas foram realizadas entre os meses de setembro e outubro de 2023.

Em seguida, foram identificados os trabalhos aderentes aos critérios de inclusão e exclusão, indicados nos Quadros 4 e 5, refletindo o corpus final para a etapa de análise, chegando-se a 22 textos. Essa etapa foi realizada entre novembro de 2023 e janeiro de 2024.

Quadro 4 – Critérios de Inclusão

Fonte: elaborado pelas autoras (2024).

Quadro 5 – Critérios de Exclusão

Fonte: elaborado pelas autoras (2024).

Finalizada a etapa de extração dos dados, foram realizadas a análise, a interpretação e a documentação dos resultados encontrados nos estudos, tendo em vista a pergunta principal e as perguntas secundárias previstas nesta RSL. Essa etapa foi realizada entre os meses de janeiro e fevereiro de 2024 com o apoio do software Atlas TI.

3. RESULTADOS E DISCUSSÃO

A construção de ontologias é crucial na Ciência da Informação para a estruturação e interpretação de informações complexas. Tem sido objeto de intensas pesquisas e inovações, abrangendo diversas áreas e aplicando uma variedade de abordagens para melhorar a eficiência e a precisão na estruturação do conhecimento. A seguir, no Quadro 6, um resumo das metodologias identificadas nos estudos referenciados:

Quadro 6 – Panorama das metodologias identificadas nos estudos

 

Fonte: elaborado pelas autoras (2024).

3.1 METODOLOGIAS DE APRENDIZAGEM DE ONTOLOGIAS

Nesta seção, são apresentadas as metodologias identificadas na revisão de literatura. Em 2018, Deb et al. propuseram o uso de taxonomias para criação automática de ontologias no sistema agrícola, diferenciando-se dos métodos convencionais que utilizam dados não estruturados. A validação experimental no domínio agrícola mostrou que essa abordagem pode aprimorar significativamente a precisão e a eficiência na gestão de dados agrícolas.

Outro estudo de 2018 foi desenvolvido por Yadav et al., que criaram a aplicação EasyOnto, uma plataforma colaborativa que facilita a construção de ontologias por meio de uma interface gráfica intuitiva. A colaboração entre usuários permite a criação e o aprimoramento contínuo das ontologias, promovendo uma abordagem democrática e inclusiva.

Também em 2018, Enea et al. apresentaram uma metodologia baseada na cognição humana para gerenciar incertezas na aprendizagem de ontologias, utilizando extração automática de triplas e validação humana. Essa abordagem garante a precisão e a validade das ontologias, integrando o raciocínio humano no processo automatizado.

Ainda em 2018, Rodriguez e Aguilar propuseram um sistema para extração de conhecimento de textos HTML não estruturados, organizando-os semanticamente em um Grafo de Aprendizagem. Essa metodologia é crucial para transformar dados não estruturados em conhecimento organizado e acessível.

Malchiodi, Da Costa Pereira e Tettamanzi (2018) aplicaram modelos de regressão para prever pontuações de axiomas em ontologias, mostrando resultados satisfatórios. Essa abordagem é essencial para a validação de ontologias complexas, garantindo sua precisão e confiabilidade.

Gyrard, Zimmermann e Sheth, em 2018, propuseram uma metodologia para enriquecer catálogos de ontologias em IoT e cidades inteligentes. A análise e a melhoria de catálogos existentes demonstram a importância de ontologias bem estruturadas para o desenvolvimento de cidades inteligentes baseadas em tecnologias IoT.

Ainda em 2018, Aggoune desenvolveu uma abordagem semântica para a aprendizagem automática de ontologias a partir de bancos de dados relacionais heterogêneos no domínio de riscos alimentares. Utilizando uma sequência de algoritmos, essa metodologia assegura a extração e a integração precisas de classes e relações, essenciais para a segurança alimentar.

Passando para 2019, Nguyen e Tettamanzi apresentaram uma metodologia para descobrir axiomas a partir de dados RDF, utilizando um algoritmo computacional para identificar axiomas de classes disjuntos. Esse método é essencial para garantir a consistência lógica das ontologias, permitindo a detecção de inconsistências e a inferência de informações implícitas, crucial para a Web Semântica.

Também em 2019, Noura et al. introduziram a metodologia KE4WoT para extração de conhecimento, utilizando um corpus de 4.500 artigos científicos para identificar tópicos importantes. Essa abordagem não só automatiza a identificação de tópicos, mas também aprimora a interoperabilidade e padronização, essenciais para o desenvolvimento de aplicações semânticas.

Vedula, Maneriker e Parthasarathy, ainda em 2019, apresentaram o framework BOLT-K, que utiliza redes neurais para aprender hierarquias ontológicas em novos domínios, transferindo conhecimento existente. Essa metodologia reduz a necessidade de especialistas, tornando o processo de construção de ontologias mais eficiente.

Em 2020, Gómez-Suta, Echeverry-Correa e Soto-Mejía propuseram um método para aprender ontologias a partir de textos sobre o conflito armado colombiano, utilizando agrupamento semântico para extrair e validar conceitos. Essa abordagem é vital para organizar e interpretar informações em contextos específicos e complexos.

Salatino et al. (2020) apresentaram uma metodologia para produzir ontologias de tópicos de pesquisa a partir de metadados acadêmicos, oferecendo um portal web para explorar e fornecer feedback sobre a ontologia desenvolvida. A capacidade de focar em ramos específicos ou produzir uma ontologia completa destaca a flexibilidade e utilidade dessa abordagem.

Avançando para 2021, Drissi et al. introduziram a metodologia Norms2Onto, que utiliza técnicas de machine learning para construção automática e semiautomática de ontologias a partir de um corpus textual. Comparada a métodos tradicionais, essa abordagem se destaca por sua eficiência e precisão, automatizando tarefas que tradicionalmente exigiriam intervenção humana intensiva.

Na área de turismo, Hananto, Serdült e Kryssanov, também em 2021, aplicaram a técnica de modelagem de tópicos para automatizar a rotulação de conteúdo, facilitando a construção de ontologias. Essa metodologia não apenas melhora a organização da informação, mas também contribui para sistemas de recomendação mais eficazes, demonstrando a aplicabilidade prática das ontologias em setores específicos.

No domínio da Ciência da Computação, Santosa, Miyazaki e Han (2021) propuseram uma extensão automática de ontologias, avaliando diferentes algoritmos para identificar a sequência mais adequada. Essa pesquisa contribui para a expansão contínua das ontologias, garantindo sua relevância e atualidade.

Sattar et al. (2021) destacaram-se por sua flexibilidade para lidar com a complexidade e o tamanho das bases de conhecimento. Essa abordagem é particularmente útil em domínios nos quais a base de conhecimento está em constante expansão e diversificação.

Rajaonarivo, Mine e Arakawa (2021) propuseram uma abordagem dinâmica para a construção de ontologias a partir de publicações no Twitter, utilizando algoritmos que convertem tweets em instâncias na ontologia e atualizam dinamicamente com novos dados. Essa metodologia é especialmente relevante para domínios nos quais os dados são gerados continuamente e precisam ser incorporados rapidamente.

Khemiri et al. (2021) introduziram uma abordagem para a construção automática de ontologias usando LDA, criando conceitos e inter-relacionamentos a partir de textos. A estabilidade do modelo, independentemente das mudanças no corpus, destaca a robustez dessa metodologia.

Sadeghianasl et al. (2021) utilizaram técnicas de crowdsourcing e gamificação para aprender ontologias de atividades de processo a partir de logs de eventos, promovendo o engajamento dos usuários. Essa metodologia demonstra como a participação ativa dos usuários pode melhorar a qualidade das ontologias.

Ainda em 2021, Jalil, Nasir e Nasir forneceram uma revisão abrangente de técnicas de sumarização extrativa de múltiplos documentos, contribuindo para a gestão de grandes volumes de dados.

Assim, as metodologias revisadas demonstram evolução contínua e diversificada das técnicas para a construção de ontologias, abrangendo uma ampla gama de domínios e abordagens para melhorar a estruturação e interpretação de informações complexas. No Quadro 7, a seguir, são apresentadas as metodologias mais relevantes identificadas, destacando suas contribuições e particularidades:

Quadro 7 – Metodologias identificadas

Fonte: elaborado pelas autoras (2024).

3.2 ETAPAS/FASES DAS METODOLOGIAS DE APRENDIZAGEM DE ONTOLOGIAS

Nesta seção, são apresentadas as etapas e as fases das metodologias identificadas na revisão de literatura. Buscou-se captar tanto os estudos que detalham todas as etapas quanto etapas isoladas, para obter direcionamentos para esta pesquisa.

Em 2018, Deb et al. produziram uma metodologia para o domínio agrícola que utiliza taxonomias organizadas em uma base de conhecimento. As etapas envolvem categorização dos dados taxonômicos, pré-processamento de textos, construção de uma biblioteca de algoritmos para extração de relacionamentos e mapeamento ontológico, e definição de restrições do modelo com a ajuda de especialistas.

Yadav et al. (2018) desenvolveram a aplicação EasyOnto, uma plataforma colaborativa que facilita a construção de ontologias em sete etapas, desde a escolha do domínio até a criação de vínculos entre categorias. A interface gráfica intuitiva permite que usuários contribuam com novas instâncias, categorias e relações, promovendo uma abordagem inclusiva.

Outro estudo de 2018, de Enea et al., introduziu um método baseado em jogos interrogativos para validar ontologias, utilizando raciocínio indutivo e dedutivo. A interação entre a aplicação e o operador humano melhora o processo de aprendizagem de ontologias.

Rodriguez e Aguilar (2018) desenvolveram uma aplicação para extração de conhecimento de textos não estruturados, utilizando técnicas de processamento de linguagem natural para separar textos em frases, analisar entidades e relações, e atualizar um Grafo de Aprendizagem.

Gyrard, Zimmermann e Sheth (2018) propuseram uma metodologia para enriquecer catálogos de ontologias em IoT e cidades inteligentes, dividida em cinco etapas: investigação de novos domínios, atualização do dicionário, atualização do catálogo RDF, atualização da página HTML e desenvolvimento de aplicações baseadas no catálogo.

Ainda em 2018, Aggoune desenvolveu uma abordagem semântica para a aprendizagem automática de ontologias a partir de bancos de dados relacionais heterogêneos no domínio de riscos alimentares. Utilizando uma sequência de algoritmos, essa metodologia assegura a extração e a integração precisas de classes e relações, essenciais para a segurança alimentar.

Nguyen e Tettamanzi (2019) apresentaram uma metodologia para descobrir axiomas a partir de dados RDF, utilizando um algoritmo computacional para identificar axiomas de classes disjuntos. Esse método é essencial para garantir a consistência lógica das ontologias, permitindo a detecção de inconsistências e a inferência de informações implícitas, crucial para a Web Semântica.

No domínio da Web of Things, Noura et al. (2019) detalharam a metodologia KE4WoT em dez etapas, desde a seleção de ontologias até a identificação de tópicos populares, demonstrando a aplicabilidade prática em diversos domínios.

Ainda em 2019, Vedula, Maneriker e Parthasarathy (2019) descreveram o framework BOLT-K, que identifica pares de conceitos e as relações entre eles, usando dados anotados para construir ontologias completas. A abordagem é promissora, mas necessita de um detalhamento mais exaustivo das etapas.

No ano de 2020, foram recuperados dois estudos. O primeiro, de Gómez-Suta, Echeverry-Correa e Soto-Mejía (2020), no qual os autores propuseram um método para aprendizagem de ontologias no contexto do conflito armado colombiano, utilizando técnicas de agrupamento semântico para extrair e validar conceitos. A proposta é acessível e aplicável a dados e domínios com recursos de conhecimento estruturados limitados. O segundo, de Salatino et al. (2020), que detalharam uma metodologia para gerar ontologias de tópicos de pesquisa, processando metadados acadêmicos e fontes externas. A criação de um portal para explorar e fornecer feedback sobre a ontologia desenvolvida demonstra um compromisso com a evolução contínua e a participação da comunidade científica.

Mas foi em 2021 que se obteve um maior número de estudos relacionados à metodologia de aprendizagem de ontologias, somando-se oito documentos no total.  Drissi et al. (2021) introduziram a metodologia Norms2Onto, que utiliza técnicas de machine learning para construção automática e semiautomática de ontologias a partir de um corpus textual. Comparada a métodos tradicionais, essa abordagem se destaca por sua eficiência e precisão, automatizando tarefas que tradicionalmente exigiriam intervenção humana intensiva.

Os autores Hananto, Serdült e Kryssanov (2021) propuseram um padrão de modelagem de tópicos no setor de turismo, dividido em três partes: descoberta de tópicos, etiquetagem automatizada e treinamento de classificadores. Os tópicos são mapeados em um modelo de conhecimento construído a partir de uma revisão de literatura e uma ontologia geral existente, utilizando uma taxonomia da DBPedia para identificar classes de destinos turísticos.

Utilizando a Design Science Research, Sattar et al. (2021) detalharam uma abordagem Methodology (DSRM), dividida em três estágios: pré-conceitualização, conceitualização e pós-conceitualização. Cada estágio abrange várias fases, como estruturação de um Gráfico de Gantt, definição de ferramentas, aquisição de conhecimento, validação, construção colaborativa e manutenção.

Rajaonarivo, Mine e Arakawa (2021) apresentaram uma metodologia de seis fases para extração de ontologias a partir de dados do Twitter, incluindo coleta de tweets, descoberta de entidades, filtragem de entidades, enriquecimento de informações, geração/atualização de ontologias e avaliação. A clareza das fases facilita a replicação e a validação da metodologia.

No domínio da Ciência da Computação, Santosa, Miyazaki e Han (2021) discutiram a extensão automática de ontologias, composta por cinco etapas: extração de tópicos, criação de um gráfico de tópicos, estruturação de um dicionário de tópicos, análise do nível dos tópicos e filtragem de links inadequados.

Khemiri et al. (2021) propuseram uma abordagem para construção automática de ontologias usando LDA, dividida em cinco módulos: pré-processamento, extração de termos, modelagem de tópicos, extração de conceitos e relações, e visualização de ontologias. A metodologia destaca-se pela robustez e capacidade de responder a questões básicas sobre a ontologia.

Já Sadeghianasl et al. (2021) utilizaram técnicas de crowdsourcing e gamificação para aprender ontologias de atividades de processo a partir de logs de eventos, promovendo o engajamento dos usuários. Essa metodologia demonstra como a participação ativa dos usuários pode melhorar a qualidade das ontologias.

Por fim, Jalil, Nasir e Nasir (2021) forneceram uma revisão abrangente de técnicas de sumarização extrativa de múltiplos documentos, contribuindo para a gestão de grandes volumes de dados. A seguir, no Quadro 8, é possível identificar um consolidado das etapas e fases identificadas nas metodologias referenciadas.

Quadro 8 – Etapas e fases das metodologias

Fonte: Elaborado pelas autoras (2024).

3.3 DIFERENCIAIS, LACUNAS E PRINCIPAIS RESULTADOS DAS METODOLOGIAS DE APRENDIZAGEM DE ONTOLOGIAS

Nesta seção, são apresentados os diferenciais, as lacunas e os principais resultados das metodologias propostas pelos autores, identificados na pesquisa. Os diferenciais das metodologias de geração automática de ontologias são evidentes em diversos estudos.

Yadav et al. (2018) enfatizam que o sistema proposto pelos autores acelerou a fase de aquisição de ontologias, eliminando a necessidade de especialistas nas fases iniciais. Rodriguez e Aguilar (2018) afirmam que o sistema criado permitiu atualizar ontologias e léxicos simultaneamente. Gyrard, Zimmermann e Sheth (2018) destacam que a metodologia proposta promove a reutilização de ontologias e a interoperabilidade semântica em aplicações de cidades inteligentes. Deb et al. (2018) argumentam que sua aplicação pode ajudar na aprendizagem automática de ontologias a partir de textos taxonômicos e pode ser usada em outras áreas devido à sua natureza genérica. Aggoune (2018) destaca a eficiência na geração de ontologias completas, sem erros técnicos, com baixo custo e tempo de aprendizado, além de um protótipo que ocupa menos espaço em disco.

Noura et al. (2019) afirmam que o KE4WoT reduz o tempo de desenvolvimento e a carga de trabalho humano, promovendo a reutilização de tópicos e mantendo as ontologias atualizadas. Vedula, Maneriker e Parthasarathy (2019) ressaltam que sua aplicação é flexível e generalizável para aprender ontologias em subdomínios emergentes, reduzindo a necessidade de conhecimento manual e detectando novos tipos de relacionamentos. Nguyen e Tettamanzi (2019) confirmam a precisão e a cobertura de sua abordagem para extração de axiomas, destacando a geração de axiomas complexos.

Gómez-Suta, Echeverry-Correa e Soto-Mejía (2020) afirmam que sua abordagem permite validar ontologias abstratas sem avaliação manual, sendo acessível em termos de tempo e recursos, e aplicável a domínios com poucos recursos de conhecimento estruturado. Salatino et al. (2020) detalham uma metodologia para gerar ontologias de tópicos de pesquisa, processando metadados acadêmicos e fontes externas. A criação de um portal para explorar e fornecer feedback sobre a ontologia desenvolvida demonstra um compromisso com a evolução contínua e a participação da comunidade científica.

Drissi et al. (2021) destacam que a metodologia Norms2Onto extraiu automaticamente 2.000 conceitos de cinco normas contábeis, enquanto a classificação manual extraiu apenas 50. A aplicação também identificou 1.900 conceitos relevantes e 1.860 subcategorias validadas pelo dicionário Investopedia, em contraste com 45 conceitos relevantes identificados manualmente. Hananto, Serdült e Kryssanov (2021) mencionam que a abordagem baseada no modelo LDA alcançou uma precisão média de 70% na rotulagem automatizada, superando a anotação manual. Khemiri et al. (2021) destacam que a ontologia desenvolvida facilita a anotação automática de documentos acadêmicos, proporcionando um processo mais consistente. Santosa, Miyazaki e Han (2021) ressaltam que a abordagem por eles proposta foi avaliada empiricamente e por especialistas, demonstrando melhor desempenho global.

Em contrapartida, poucos autores indicaram lacunas em suas metodologias. Hananto, Serdült e Kryssanov (2021) observaram que o modelo LDA não conseguiu dividir revisões em tópicos suficientemente distintos, resultando em anotações incorretas em algumas classes. Vedula, Maneriker e Parthasarathy (2019) apontaram que a aplicação BOLT-K requer intervenção manual para definir domínios relacionados durante o aprendizado de ontologias.

Com relação aos resultados, Drissi et al. (2021) mostraram que o desempenho do modelo Norms2Onto superou a classificação manual, apresentando oportunidades para novas pesquisas. Deb et al. (2018) argumentam que sua aplicação pode ajudar na aprendizagem automática de ontologias a partir de textos taxonômicos e pode ser usada em outras áreas devido à sua natureza genérica. Nguyen e Tettamanzi (2019) confirmam a precisão e cobertura de sua abordagem para extração de axiomas, destacando a geração de axiomas complexos. Rajaonarivo, Mine e Arakawa (2021) validaram a confiabilidade das informações na ontologia desenvolvida. Santosa, Miyazaki e Han (2021) demonstraram a viabilidade da extensão automática de ontologias no domínio da Ciência da Computação. Vedula, Maneriker e Parthasarathy (2019) ressaltam que sua aplicação é flexível e generalizável para aprender ontologias em subdomínios emergentes, reduzindo a necessidade de conhecimento manual e detectando novos tipos de relacionamentos. Gyrard, Zimmermann e Sheth (2018) destacam que a metodologia proposta promove a reutilização de ontologias e a interoperabilidade semântica em aplicações de cidades inteligentes. Gómez-Suta, Echeverry-Correa e Soto-Mejía (2020) afirmam que sua abordagem permite validar ontologias abstratas sem avaliação manual, sendo acessível em termos de tempo e recursos, e aplicável a domínios com poucos recursos de conhecimento estruturado. A seguir, no Quadro 9, um resumo dos diferenciais, lacunas e resultados identificados.

Quadro 9 – Diferenciais, lacunas e resultados

Fonte: Elaborado pelas autoras (2024).

4. CONSIDERAÇÕES FINAIS

A análise das pesquisas sobre a aprendizagem de ontologias revela uma carência significativa na descrição detalhada das metodologias adotadas. A maioria dos trabalhos menciona a utilização de técnicas de automatização, sem aprofundar nas etapas específicas. No entanto alguns estudos, como os de Sattar et al. (2021) e Noura et al. (2019), oferecem descrições mais claras e detalhadas, contribuindo para uma melhor compreensão do processo.

Há uma alta aplicação de algoritmos computacionais, incluindo aprendizagem de máquina, modelagem de tópicos, grafos, modelos de regressão e descoberta de tópicos. Algumas abordagens adotam estratégias de colaboração e crowdsourcing para a construção e avaliação de ontologias. Destaca-se que poucas metodologias mencionam o uso de taxonomias ou outros vocabulários controlados, comuns na área de BCI, e raramente se referem ao uso de ontologias de referência ou de topo.

Muitos trabalhos focam na construção de frameworks ou aplicações, sem detalhar o passo a passo para automatizar a criação de ontologias. A variabilidade no detalhamento metodológico é ampla: enquanto alguns estudos fornecem descrições detalhadas, outros se concentram apenas em componentes específicos.

A análise comparativa dos estudos revela avanços significativos e áreas para melhorias na aprendizagem de ontologias. Metodologias como Norms2Onto (Drissi et al., 2021) e KE4WoT (Noura et al., 2019) destacam-se pela automatização de processos complexos, reduzindo a necessidade de intervenção manual e garantindo maior precisão e consistência. Porém há limitações, como a dificuldade de distinguir tópicos distintos (Hananto, Serdült e Kryssanov, 2021) e a necessidade de intervenção manual para definir domínios relacionados (Vedula, Maneriker e Parthasarathy, 2019).

A geração automática de ontologias apresenta potencial significativo, mas desafios como precisão, flexibilidade e aplicabilidade em diversos domínios precisam ser abordados continuamente. Para avançar no campo da aprendizagem de ontologias, é crucial que estudos futuros forneçam descrições mais completas e sistemáticas de suas metodologias, permitindo maior replicabilidade e aplicação prática.

As contribuições deste estudo vão além da proposta de uma metodologia, identificando direções futuras para pesquisas na interseção entre geração automática de ontologias e governo eletrônico. Espera-se que as descobertas inspirem investigações adicionais e estimulem a implementação de estratégias inovadoras no governo eletrônico, aprimorando a eficiência, a transparência e a acessibilidade dos serviços públicos digitais.

AGRADECIMENTOS

A segunda coautora agradece ao Conselho Nacional de Pesquisa e Desenvolvimento; ao Ministério da Educação, pela concessão da bolsa de Produtividade de Pesquisa através do processo número PQ-1D – Processo 313645/2020-5.

A primeira coautora agradece ao Grupo de pesquisa Modelagem Conceitual para Organização e Representação da Informação Hipertextual (MHTX) e ao Serviço Federal de Processamento de Dados (SERPRO).

REFERÊNCIAS

AGGOUNE, Aicha. Automatic ontology learning from heterogeneous relational databases: Application in alimentation risks field. In: AMINE, A; MOUHOUB, M.; MOHAMED, A.; DJEBBAR, B. (ed.) Computational Intelligence and Its Applications. Cham, Alemanha: Springer International Publishing, 2018. p. 199-210.

ALHARBI, Reham; TAMMA, Valentina; GRASSO, Floriana. Characterising the gap between theory and practice of ontology reuse. In: PROCEEDINGS OF THE 11TH ON KNOWLEDGE CAPTURE CONFERENCE, 11., 2021, New York, NY, United States. Proceedings […]. New York: Association for Computing Machinery, 2021. p. 217-224.

ARAÚJO, Webert Júnio et al. Proposta metodológica para enriquecimento de ontologias de domínio. 271 f. Tese (Doutorado em Ciência da Informação) – Escola de Ciência da Informação, Universidade Federal de Minas Gerais, Belo Horizonte, 2021. Disponível em: <https://repositorio.ufmg.br/handle/1843/38983>. Acesso em: 12 jul. 2024.

DEB, Chandan Kumar et al. A framework for ontology learning from taxonomic data. In: AGGARWAL, V. B.; BHATNAGAR, V.; MISHRA, D. K. Big Data Analytics: Proceedings of CSI 2015. Singapore: Springer Singapore, 2018. p. 29-37. vol. 654.

DRISSI, Amani et al. A New Automatic Ontology Construction Method Based on Machine Learning Techniques: Application on Financial Corpus. In: PROCEEDINGS OF THE 13TH INTERNATIONAL CONFERENCE ON MANAGEMENT OF DIGITAL ECOSYSTEMS, 13., 2021, New York, NY, USA. Proceedings […]. New York: Association for Computing Machinery, 2021. p. 57-61.

ENEA, Roberto et al. How to Support Human Operator in “Uncertainty” Managing during the Ontology Learning Process. In: COMPANION PROCEEDINGS OF THE THE WEB CONFERENCE 2018 (WWW ’18), 18., 2018, Lyon, France. Proceedings […] Republic and Canton of Geneva, Stwitzerland: International World Wide Web Conferences Steering Committee, 2018. p. 1147-1154.

GÓMEZ-SUTA, Manuela; ECHEVERRY-CORREA, Julián D.; SOTO-MEJÍA, José A. Semi-automatic extraction and validation of concepts in ontology learning from texts in Spanish. In: PROCEEDINGS OF THE 10TH INTERNATIONAL CONFERENCE ON WEB INTELLIGENCE, MINING AND SEMANTICS. 10., 2020, New York, NY, United States. Proceedings […]. New York: Association for Computing Machinery, 2020. p. 7-16.

GYRARD, Amelie; ZIMMERMANN, Antoine; SHETH, Amit. Building IoT-based applications for smart cities: How can ontology catalogs help?. IEEE Internet of Things Journal, United States, v. 5, n. 5, p. 3978-3990, 2018.

GRUBER, Thomas R. 1993. A Translation Approach to Portable Ontology Specifications. Knowledge Acquisition,  California, v.5, p. 199–220, 1993.

HANANTO, Valentinus R.; SERDÜLT, Uwe; KRYSSANOV, Victor. A Tourism Knowledge Model through Topic Modeling from Online Reviews. In: INTERNATIONAL CONFERENCE ON COMPUTING AND DATA ENGINEERING, 7., 2021 Phuket, Thailand, 15–17 January 2021. Proceedings […]. New York: Association for Computing Machinery, 2021. p. 87-93.

JALIL, Zakia; NASIR, Jamal Abdul; NASIR, Muhammad. Extractive Multi-Document Summarization: A Review of Progress in the Last Decade. IEEE Access, United States, v. 9, p. 130928-130946, 2021.

KHEMIRI, Ahmed et al. Learn2Construct: an automatic ontology construction based on LDA from texual data. In: PROCEEDINGS OF THE 13TH INTERNATIONAL CONFERENCE ON MANAGEMENT OF DIGITAL ECOSYSTEMS, 13., 2021, New York, NY. Proceedings […]. New York: Association for Computing Machinery, 2021. p. 49-56. 

KITCHENHAM, Barbara. Procedures for performing systematic reviews. Keele, UK, Keele University, United Kingdom, v. 33, n. 2004, p. 1-26, 2004. Disponível em: <https://citeseerx.ist.psu.edu/document?repid=rep1&type=pdf&doi=29890a936639862f45cb9a987dd599dce9759bf5>. Acesso em: 12 jul. 2024.

MALCHIODI, Dario; DA COSTA PEREIRA, Célia; TETTAMANZI, Andrea GB. Predicting the possibilistic score of OWL axioms through support vector regression. In: SCALABLE UNCERTAINTY MANAGEMENT: 12TH INTERNATIONAL CONFERENCE, SUM 2018, 12., 2018. Milan, Italy. Proceedings […]. Milan, Italy: Springer International Publishing, October 3-5, 2018. p. 380-386.

MALCHIODI, Dario; TETTAMANZI, Andrea GB. Predicting the possibilistic score of OWL axioms through modified support vector clustering. In: PROCEEDINGS OF THE 33RD ANNUAL ACM SYMPOSIUM ON APPLIED COMPUTING, 33., 2018. Pau, France. Proceedings […]. New York: Association for Computing Machinery, 2018. p. 1984-1991.

NGUYEN, Thu Huong; TETTAMANZI, Andrea GB. An evolutionary approach to class disjointness axiom discovery. In: IEEE/WIC/ACM INTERNATIONAL CONFERENCE ON WEB INTELLIGENCE, 2019, Greece. Proceedings […]. Greece: IEEE, 2019. p. 68-75.

NOURA, Mahda et al. Automatic knowledge extraction to build semantic web of things applications. IEEE Internet of Things Journal, v. 6, n. 5, p. 8447-8454, 2019.

RAJAONARIVO, Landy; MINE, Tsunenori; ARAKAWA, Yutaka. Automatic generation of event ontology from social network and mobile positioning data. In: IEEE/WIC/ACM INTERNATIONAL CONFERENCE ON WEB INTELLIGENCE AND INTELLIGENT AGENT TECHNOLOGY,  2021, New York. Proceedings […]. New York: IEEE, 2021. p. 87-94.

RODRIGUEZ, Taniana; AGUILAR, Jose. Knowledge extraction system from unstructured documents. IEEE Latin America Transactions, United States, v. 16, n. 2, p. 639-646, 2018.

SADEGHIANASL, Sareh et al. Process activity ontology learning from event logs through gamification. IEEE Access, United States, v. 9, p. 165865-165880, 2021.

SALATINO, Angelo A. et al. The computer science ontology: A comprehensive automatically-generated taxonomy of research areas. Data Intelligence, United States, v. 2, n. 3, p. 379-416, 2020.

SANTOSA, Natasha C.; MIYAZAKI, Jun; HAN, Hyoil. Automating computer science ontology extension with classification techniques. IEEE Access, United States, v. 9, p. 161815-161833, 2021.

SATTAR, Abdul et al. An improved methodology for collaborative construction of reusable, localized, and shareable ontology. IEEE Access, United States, v. 9, p. 17463-17484, 2021.

VEDULA, Nikhita; MANERIKER, Pranav; PARTHASARATHY, Srinivasan. Bolt-k: Bootstrapping ontology learning via transfer of knowledge. In: THE WORLD WIDE WEB CONFERENCE, 19., 2019, New York. Proceedings […]. New York: Association for Computing Machinery, 2019. p. 1897-1908.

YADAV, Usha et al. EasyOnto: A Collaborative Semiformal Ontology Development Platform. In: PANIGRAHI, B., HODA, M., SHARMA, V., GOEL, S. (ed.). Nature Inspired Computing: Proceedings of CSI 2015. Singapore: Springer Singapore, 2018. p. 1-11.

APÊNDICE – NOTA DE RODAPÉ

3. Uma das definições mais amplamente reconhecidas de ontologia é a de Gruber (1993), que a descreve como uma especificação explícita de uma conceituação, abrangendo tudo o que pode ser formalmente representado. Em um domínio específico do conhecimento, uma ontologia facilita a associação entre os nomes de entidades e suas descrições, de forma que sejam compreensíveis tanto para seres humanos quanto para sistemas computacionais, garantindo uma representação estruturada e compartilhável desse conhecimento.

[1] Mestrado em Gestão e Organização do Conhecimento; Especialização em Gestão Pública; Especialização em Design Instrucional para EaD Virtual; Especialização em Produção em Mídias Digitais; Especialização em Educação a Distância; Graduação em Pedagogia. ORCID: https://orcid.org/0000-0002-4063-3238. Currículo Lattes: http://lattes.cnpq.br/0612391970550169.

[2] Orientadora. Professora Titular no Departamento de Organização e Tratamento da Informação, na ECI/UFMG. Pós-doutora em Estudos sobre metodologias para o processo de indexação de documentos textuais, pelo Departamento de Biblioteconomia y Documentación, Faculdad de Humanidades, Comunicación y Documentación, Universidad Carlos III, Madrid, Espanha, e pela Escola de Artes e Comunicação da USP. Doutora em Ciência da Informação pelo Programa de Pós-Graduação em Ciência da Informação PPGCI-ECI/UFMG. Mestre em Science in Library Service – Clark Atlanta University. Bibliotecária pela Escola de Biblioteconomia da UFMG. Bolsista de Produtividade em Pesquisa do CNPq – (PQ) Nível 1D. Bolsista do Programa Pesquisador Mineiro-PPM XII-2018 da FAPEMIG. Pesquisadora no Programa de Pós-Graduação em Gestão Organização do Conhecimento-PPGGOC/ECI/UFMG. Coordenadora do Grupo de Pesquisa MHTX – Modelagem Conceitual para Organização e Representação da Informação Hipertextual, registrado no CNPq desde 2004. ORCID: https://orcid.org/0000-0003-0735-3856. Currículo Lattes: http://lattes.cnpq.br/3183050056105009.

Material recebido: 08 de agosto de 2024.

Material aprovado pelos pares: 30 de agosto de 2024.

Material editado aprovado pelos autores: 01 de novembro de 2024.

5/5 - (10 votos)
Patrícia Lopes Ferreira

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Pesquisar por categoria…
Este anúncio ajuda a manter a Educação gratuita