publication . Conference object . 2019

From massive databases to Web of data: disambiguation and alignment of geographical entities in scientific texts

Cuxac, Pascal; Collignon, Alain; Gregorio, Stéphanie; Parmentier, François;
French
  • Published: 09 Oct 2019
  • Publisher: HAL CCSD
  • Country: France
Abstract
International audience; In this paper we present an automatic approach to disambiguate and align geographic entities. A method based on word embeddings allows, from unsupervised learning, to remove ambiguity with polysemic terms. This allows automatic alignment with different databases (BNF, wikidata...) having a triplestore. We then use semantic web technologies, both to expose the data in a different way (data.istex) but also to allow complex queries that cannot be solved from traditional search engines. We will discuss a concrete case based on the ISTEX database, and a qualitative evaluation of the method will be proposed.; Dans cet article nous présentons une approche automatique visant à désambiguïser et aligner des entités géographiques de type placeName. Une méthode basée sur des plongements lexicaux permet, à partir d'un apprentissage non supervisé de lever l'ambiguïté face à un terme polysémique. Cela permet alors un alignement automatique avec différents réservoirs (BNF, wikidata…) possédant un triplestore. Nous utilisons alors les technologies du web sémantique, pour à la fois exposer les données de façon différente (data.istex) mais également autoriser des requêtes complexes impossibles à résoudre à partir de moteurs de recherche classiques. Nous aborderons un cas concret basé sur le réservoir ISTEX, et une évaluation qualitative de la méthode sera proposée.
Subjects
free text keywords: Web of Data, Linked Open Data, Automatic alignment, Disambiguation, Geographic entities, Web de données, Données ouvertes liées, Alignement automatique, Désambiguïsation, Entités géographiques, [SHS.INFO]Humanities and Social Sciences/Library and information sciences
Related Organizations
Any information missing or wrong?Report an Issue