search
Include:
The following results are related to DARIAH EU. Are you interested to view more results? Visit OpenAIRE - Explore.
19 Research products, page 1 of 2

  • DARIAH EU
  • Publications
  • Other research products
  • 2018-2022
  • French
  • Hyper Article en Ligne
  • Hal-Diderot

10
arrow_drop_down
Relevance
arrow_drop_down
  • French
    Authors: 
    Angela Cossu;
    Publisher: HAL CCSD
    Country: France

    International audience

  • French
    Authors: 
    Renault, Stéphane; Nouvel, Blandine;
    Publisher: HAL CCSD

    International audience; Access to primary data, particularly in archaeology and archaeosciences, remains limited. However, this question is a major issue in scientific research. The Laboratoire méditerranéen de préhistoire Europe-Afrique (LaMPEA-UMR 7269), within the network of archaeology laboratories in the Aix Marseille University area, is developing a collaborative and interdisciplinary digital platform ArcaDIIS (Archaeological Data Infrastructure for Interoperability and Sharing), for the interoperability and sharing of archaeology data and related disciplines, particularly in the fields of the environment, archaeometry, life sciences and health. Adopting semantic web technologies, international interoperability standards and specialized disciplinary vocabularies, this platform aims to meet the needs of qualitative resource management. It proposes the editorialization and enhancement of data sets, with a view to sustainability, accessibility and reuse. It also plans to host documentation and modelling resources in specific formats and evaluated publications, whether related to the data sets on ArcaDIIS or produced independently throughout the life cycle of a research project/program.Translated with www.DeepL.com/Translator; L'accès aux données primaires, particulièrement en archéologie et en archéosciences, reste encore limité. Cette question est pourtant un enjeu majeur de la recherche scientifique. Le Laboratoire méditerranéen de préhistoire Europe-Afrique (LaMPEA-UMR 7269), au sein du réseau des laboratoires d'archéologie du périmètre d'Aix Marseille Université, porte le développement d'une plateforme numérique collaborative et interdisciplinaire ArcaDIIS (Archaeological Data Infrastructure for Interoperability and Sharing), pour l'interopérabilité et le partage des données de l'archéologie et des disciplines qui y sont rattachées, notamment dans les domaines de l'environnement, de l'archéométrie, des sciences de la vie et de la santé. Adoptant les technologies du web sémantique, les standards internationaux d'interopérabilité et les vocabulaires spécialisés de disciplines, cette plateforme entend répondre aux besoins en gestion qualitative de ressources. Elle propose l'éditorialisation et la valorisation des jeux de données, dans une perspective de pérennisation, d'accessibilité et de réutilisation. Elle envisage en outre d'accueillir des ressources documentaires et de modélisation aux formats spécifiques et des publications évaluées, qu'elles soient liées aux jeux de données versés sur ArcaDIIS ou produites indépendamment tout au long du cycle de vie d'un projet/programme de recherche.

  • French
    Authors: 
    Masclet De Barbarin, Marie;
    Publisher: HAL CCSD
    Country: France

    International audience; Ce guide de bonnes pratiques éthiques et juridiques pour la diffusion des données en SHS est né de la réflexion d’un groupe de chercheurs, de professionnels de la documentation et de juristes structuré dans le cadre d’un groupe de travail Éthique et Droit. Face au renouvellement des problématiques liées aux droits d’auteurs, à la confidentialité, à la sécurisation et à la validation des données dans un contexte de mutation technologique, le groupe de travail Éthique et Droit a lancé un appel à communication ouvert à toutes les personnes s’intéressant aux problématiques éthiques et juridiques en matière de diffusion des données en SHS. Les auteurs ont été invités à proposer soit des retours d’expériences soit des articles portant sur les enjeux éthiques et juridiques en matière de diffusion des données en SHS, en explorant les solutions concrètes envisageables ou envisagées dans le cadre des cinq étapes de diffusion identifiées au préalable : la préparation de la recherche et l’anticipation de l’archivage ; la collecte des données ; le traitement, l’archivage et la description des données ; la diffusion des résultats de la recherche et la réutilisation des données.Il est important ici de souligner le caractère ambitieux de la démarche, à la fois prospective et réflexive, empirique et comparative, et surtout résolument pragmatique. Ce projet, labellisé par la Digital Research Infrastructure for the Arts and Humanities (DARIAH) en 2015 et financé par le Service commun de documentation (SCD) d’AMU, par la MMSH et par le consortium des ethnologues de la Très Grande Infrastructure de recherche (TGIR) Huma-Num a été supervisé par un comité scientifique qui s’est porté garant de la rigueur scientifique de la démarche.

  • French
    Authors: 
    Ginouvès, Véronique; Gras, Isabelle;
    Publisher: HAL CCSD
    Country: France

    International audience; En guise de postface, il nous a semblé nécessaire de revenir sur le processus collaboratif de la fabrication de cet ouvrage et de vous confier la genèse de ce projet. Tout est parti d'un constat pragmatique, de nos situations quotidiennes de travail : le/la chercheur·e qui produit ou utilise des données a besoin de réponses concrètes aux questions auxquelles il/elle est confronté·e sur son terrain comme lors de tous ses travaux de recherche. Produire, exploiter, diffuser, partager ou éditer des sources numériques fait aujourd'hui partie de notre travail ordinaire. La rupture apportée par le développement du web et l'arrivée du format numérique ont largement facilité la diffusion et le partage des ressources (documentaires, textuelles, photographiques, sonores ou audiovisuelles...) dans le monde de la recherche et, au-delà, auprès des citoyens de plus en plus curieux et intéressés par les documents produits par les scientifiques.

  • French
    Authors: 
    Cuxac, Pascal; Collignon, Alain; Gregorio, Stéphanie; Parmentier, François;
    Publisher: HAL CCSD
    Country: France

    International audience; In this paper we present an automatic approach to disambiguate and align geographic entities. A method based on word embeddings allows, from unsupervised learning, to remove ambiguity with polysemic terms. This allows automatic alignment with different databases (BNF, wikidata...) having a triplestore. We then use semantic web technologies, both to expose the data in a different way (data.istex) but also to allow complex queries that cannot be solved from traditional search engines. We will discuss a concrete case based on the ISTEX database, and a qualitative evaluation of the method will be proposed.; Dans cet article nous présentons une approche automatique visant à désambiguïser et aligner des entités géographiques de type placeName. Une méthode basée sur des plongements lexicaux permet, à partir d'un apprentissage non supervisé de lever l'ambiguïté face à un terme polysémique. Cela permet alors un alignement automatique avec différents réservoirs (BNF, wikidata…) possédant un triplestore. Nous utilisons alors les technologies du web sémantique, pour à la fois exposer les données de façon différente (data.istex) mais également autoriser des requêtes complexes impossibles à résoudre à partir de moteurs de recherche classiques. Nous aborderons un cas concret basé sur le réservoir ISTEX, et une évaluation qualitative de la méthode sera proposée.

  • French
    Authors: 
    Chagué, Alix; Terriel, Lucas; Romary, Laurent;
    Publisher: HAL CCSD
    Country: France

    International audience

  • French
    Authors: 
    Carmen Brando; Francesca Frontini; Mathieu Roche;
    Publisher: HAL CCSD
    Country: France

    International audience

  • French
    Authors: 
    Guichard, Éric;
    Publisher: HAL CCSD
    Country: France

    International audience

  • French
    Authors: 
    Gianola, Lucie;
    Publisher: HAL CCSD
    Country: France

    Criminal analysis is a discipline that supports investigations practiced within the National Gendarmerie. It is based on the use of the documents compiled in the judicial procedure file (witness interviews, search warrants, expert reports, phone and bank data, etc.) to synthesize the information collected and to propose a new understanding of the facts examined. While criminal analysis uses data visualization software (i. e. IBM Analyst's Notebook) to display the hypotheses formulated, the digital and textual management of the file documents is entirely manual. However, criminal analysis relies on entities to formalize its practice. The presentation of the research context details the practice of criminal analysis as well as the constitution of judicial procedure files as textual corpora. We then propose perspectives for the adaptation of natural language processing (NLP) and information extraction methods to the case study, including a comparison of the concepts of entity in criminal analysis and named entity in NLP. This comparison is done on the conceptual and linguistic plans. A first approach to the detection of entities in witness interviews is presented. Finally, since textual genre is a parameter to be taken into account when applying automatic processing to text, we develop a structure of the 'legal' textual genre into discourse, genres, and sub-genres through a textometric study aimed at characterizing different types of texts (including witness interviews) produced by the field of justice.; L'analyse criminelle est une discipline d'appui aux enquêtes pratiquée au sein de la Gendarmerie Nationale. Elle repose sur l'exploitation des documents compilés dans le dossier de procédure judiciaire (auditions, perquisitions, rapports d'expertise, données téléphoniques et bancaires, etc.) afin de synthétiser les informations collectées et de proposer un regard neuf sur les faits examinés. Si l'analyse criminelle a recours à des logiciels de visualisation de données (i. e. Analyst's Notebook d'IBM) pour la mise en forme des hypothèses formulées, la gestion informatique et textuelle des documents de la procédure est entièrement manuelle. Or, l'analyse criminelle s'appuie entre autres sur le concept d'entités pour formaliser son travail. La présentation du contexte de recherche détaille la pratique de l'analyse criminelle ainsi que la constitution du dossier de procédure judiciaire en tant que corpus textuel. Nous proposons ensuite des perspectives pour l'adaptation des méthodes de traitement automatique de la langue (TAL) et d'extraction d'information au cas d'étude, notamment la mise en parallèle des concepts d'entité en analyse criminelle et d'entité nommée en TAL. Cette comparaison est réalisée sur les plans conceptuels et linguistiques. Une première approche de détection des entités dans les auditions de témoins est présentée. Enfin, le genre textuel étant un paramètre à prendre en compte lors de l'application de traitements automatiques à du texte, nous construisons une structuration du genre textuel « légal » en discours, genres et sous-genres par le biais d'une étude textométrique visant à caractériser différents types de textes (dont les auditions de témoins) produits par le domaine de la justice.

  • French
    Authors: 
    Schöpfel, Joachim;
    Publisher: HAL CCSD
    Country: France
    Project: SSHRC

    The study aims to contribute to the implementation of the open science ecosystem in the field of a university campus. Conducted in interviews with 51 researchers, doctoral students, laboratory managers, project managers and data engineers, the study has three objectives: (Re) Put teachers-researchers at the heart of the implementation of the ecosystem of open science, identify opportunities and locks for a data policy, and determine a framework for developing the data culture on campus.Conducted as an audit on the SHS campus of the University of Lille, the study has a pragmatic scope: to identify the essential elements for a consistent policy for the production, management and reuse of research data on a campus in the humanities and social sciences, and thus contribute to the appropriation of the concept of open science. It leads to ten recommendations for the implementation of a data policy on an SHS campus:1. Set up a scientific steering2. Invest in a targeted way3. Aim projects, not laboratories4. Use management plans as leverage5. Provide answers to security constraints6. Provide answers to communication needs7. Provide answers to curation needs8. Propose several solutions for data storage9. Institutionalize the link with the TGIR Huma-Num10. Support good practices; L'étude souhaite contribuer à la mise en œuvre de l’écosystème de la science ouverte sur le terrain d’un campus universitaire. Conduite sous forme d’entretiens avec 51 chercheurs, doctorants, responsables de laboratoires, chefs de projets et ingénieurs en charge de données, l’étude poursuit trois objectifs : (Re)Mettre les enseignants-chercheurs au cœur de la mise en œuvre de l’écosystème de la science ouverte, identifier des opportunités et verrous pour une politique de données, et déterminer un cadre pour développer la culture de données sur le campus.Menée comme un audit sur le campus SHS de l'Université de Lille, l'étude a une portée pragmatique: dégager les éléments indispensables pour une politique cohérente de la production, gestion et réutilisation des données de la recherche sur un campus en sciences humaines et sociales, et contribuer ainsi à l’appropriation du concept de la science ouverte par une « mise en culture de la donnée, qui effectue une mise en sens d’usages disséminés et spécialisés de données ouvertes ». Elle aboutit à dix recommandations pour la mise en œuvre d’une politique de données sur un campus SHS :1. Mettre en place un pilotage scientifique2. Investir d’une manière ciblée3. Viser les projets, pas les laboratoires4. Utiliser les plans de gestion comme levier5. Apporter des réponses aux contraintes de sécurité6. Apporter des réponses aux besoins de communication7. Apporter des réponses aux besoins de curation8. Proposer plusieurs solutions pour la conservation des données9. Institutionnaliser le lien avec la TGIR Huma-Num10. Soutenir les bonnes pratiques