Advanced search in Research products
Research products
arrow_drop_down
Searching FieldsTerms
Any field
arrow_drop_down
includes
arrow_drop_down
Include:
The following results are related to DARIAH EU. Are you interested to view more results? Visit OpenAIRE - Explore.
52 Research products, page 1 of 6

  • DARIAH EU
  • Publications
  • 2012-2021
  • French
  • Mémoires en Sciences de l'Information et de la Communication
  • Hyper Article en Ligne - Sciences de l'Homme et de la Société
  • INRIA a CCSD electronic archive server
  • ProdInra

10
arrow_drop_down
Date (most recent)
arrow_drop_down
  • French
    Authors: 
    Chagué, Alix; Terriel, Lucas; Romary, Laurent;
    Publisher: HAL CCSD
    Country: France

    International audience

  • French
    Authors: 
    Gianola, Lucie;
    Publisher: HAL CCSD
    Country: France

    Criminal analysis is a discipline that supports investigations practiced within the National Gendarmerie. It is based on the use of the documents compiled in the judicial procedure file (witness interviews, search warrants, expert reports, phone and bank data, etc.) to synthesize the information collected and to propose a new understanding of the facts examined. While criminal analysis uses data visualization software (i. e. IBM Analyst's Notebook) to display the hypotheses formulated, the digital and textual management of the file documents is entirely manual. However, criminal analysis relies on entities to formalize its practice. The presentation of the research context details the practice of criminal analysis as well as the constitution of judicial procedure files as textual corpora. We then propose perspectives for the adaptation of natural language processing (NLP) and information extraction methods to the case study, including a comparison of the concepts of entity in criminal analysis and named entity in NLP. This comparison is done on the conceptual and linguistic plans. A first approach to the detection of entities in witness interviews is presented. Finally, since textual genre is a parameter to be taken into account when applying automatic processing to text, we develop a structure of the 'legal' textual genre into discourse, genres, and sub-genres through a textometric study aimed at characterizing different types of texts (including witness interviews) produced by the field of justice.; L'analyse criminelle est une discipline d'appui aux enquêtes pratiquée au sein de la Gendarmerie Nationale. Elle repose sur l'exploitation des documents compilés dans le dossier de procédure judiciaire (auditions, perquisitions, rapports d'expertise, données téléphoniques et bancaires, etc.) afin de synthétiser les informations collectées et de proposer un regard neuf sur les faits examinés. Si l'analyse criminelle a recours à des logiciels de visualisation de données (i. e. Analyst's Notebook d'IBM) pour la mise en forme des hypothèses formulées, la gestion informatique et textuelle des documents de la procédure est entièrement manuelle. Or, l'analyse criminelle s'appuie entre autres sur le concept d'entités pour formaliser son travail. La présentation du contexte de recherche détaille la pratique de l'analyse criminelle ainsi que la constitution du dossier de procédure judiciaire en tant que corpus textuel. Nous proposons ensuite des perspectives pour l'adaptation des méthodes de traitement automatique de la langue (TAL) et d'extraction d'information au cas d'étude, notamment la mise en parallèle des concepts d'entité en analyse criminelle et d'entité nommée en TAL. Cette comparaison est réalisée sur les plans conceptuels et linguistiques. Une première approche de détection des entités dans les auditions de témoins est présentée. Enfin, le genre textuel étant un paramètre à prendre en compte lors de l'application de traitements automatiques à du texte, nous construisons une structuration du genre textuel « légal » en discours, genres et sous-genres par le biais d'une étude textométrique visant à caractériser différents types de textes (dont les auditions de témoins) produits par le domaine de la justice.

  • French
    Authors: 
    Elie Allouche;
    Publisher: HAL CCSD
    Country: France

    International audience; Cette intervention aborde le thème des convergences entre les humanités numériques (HN) et le numérique à l'École à partir des enjeux de formation. Notre analyse s'appuie principalement sur deux champs d'observation : les formations au numérique proposées en académie à destination des professeurs des écoles, collèges et lycées ; les formations en HN, à partir d'une analyse en cours de la base Dariah course registry. Notre hypothèse est que ces formations soulèvent des questionnements communs : à quels besoins sociaux, pédagogiques et scientifiques répondent-elles ? ; quel continuum de formation au numérique de l'école à l'université ? ; quelle place du numérique dans les référentiels, les discours institutionnels ? ; quelle est la réalité des pratiques dans l'enseignement, la recherche et la formation ? ; concernant les contenus de formation, quel équilibre établir entre approches disciplinaire et interdisciplinaire, approche par les outils et les techniques et approche par la culture et/ou la conduite de projet ? A terme il s'agirait donc d'envisager une réflexion commune entre les acteurs de l'éducation et ceux de la recherche sur la question plus globale de la construction et de la diffusion des savoirs en environnement numérique.

  • French
    Authors: 
    Cuxac, Pascal; Collignon, Alain; Gregorio, Stéphanie; Parmentier, François;
    Publisher: HAL CCSD
    Country: France

    International audience; In this paper we present an automatic approach to disambiguate and align geographic entities. A method based on word embeddings allows, from unsupervised learning, to remove ambiguity with polysemic terms. This allows automatic alignment with different databases (BNF, wikidata...) having a triplestore. We then use semantic web technologies, both to expose the data in a different way (data.istex) but also to allow complex queries that cannot be solved from traditional search engines. We will discuss a concrete case based on the ISTEX database, and a qualitative evaluation of the method will be proposed.; Dans cet article nous présentons une approche automatique visant à désambiguïser et aligner des entités géographiques de type placeName. Une méthode basée sur des plongements lexicaux permet, à partir d'un apprentissage non supervisé de lever l'ambiguïté face à un terme polysémique. Cela permet alors un alignement automatique avec différents réservoirs (BNF, wikidata…) possédant un triplestore. Nous utilisons alors les technologies du web sémantique, pour à la fois exposer les données de façon différente (data.istex) mais également autoriser des requêtes complexes impossibles à résoudre à partir de moteurs de recherche classiques. Nous aborderons un cas concret basé sur le réservoir ISTEX, et une évaluation qualitative de la méthode sera proposée.

  • Open Access French
    Authors: 
    Blandine Nouvel;
    Publisher: HAL CCSD
    Country: France

    Cree par le reseau Frantiq (Federation et Ressources sur l'Antiquite), initialement pour l'indexation documentaire de la litterature scientifique, PACTOLS est un reservoir unique de metadonnees thematiques reserve a l'archeologie. Le gestionnaire de thesaurus sur lequel il s'appuie, Opentheso, lui confere en outre des capacites techniques d'ouverture et d'interoperabilite qui completent sa normalisation. De plus, l'attribution d'un identifiant perenne a chaque concept fait de chacun un objet web, reperable et citable. PACTOLS constitue ainsi, de fait, un vocabulaire pivot qui repond aux standards du web semantique et de la science ouverte. Il respecte les principes FAIR : il est consultable et accessible librement en ligne, il est interoperable et reutilisable. Ses caracteristiques lexicales et normatives representent un outil au potentiel rare, propose aujourd'hui a tous les acteurs de l'archeologie. Le projet de developpement des PACTOLS, conduit dans le cadre du Consortium MASA de la Tres Grande Infrastructure de Recherche Huma-Num, est destine a offrir a la communaute des archeologues un vocabulaire de reference qui facilite le partage, sur le web, des donnees et des productions scientifiques en archeologie. Il s'oriente dans deux directions : il s'agit d'une part de consolider la structure semantique qui aboutit a la reorganisation des domaines, facilitant la navigation dans le thesaurus. D'autre part, les contenus terminologiques sont enrichis, notamment par l'ajout de vocabulaires de specialites et par l'alignement avec des vocabulaires et des programmes scientifiques du domaine, presents sur le web. La reorganisation du thesaurus se conduit en etroite collaboration avec les experts concernes. Pour cela, les modalites de contribution dynamique au thesaurus sont elargies a tous les acteurs de la discipline, sur la base de niveaux d'autorisation specifiques. Une communaute elargie s'organise, formee et accompagnee a la prise en main partagee du thesaurus. Car PACTOLS, comme vocabulaire de reference, est preconise des le traitement des donnees de fouilles, par exemple a l'Inrap. Il est aussi associe a des programmes de valorisation des donnees de la recherche et integre par plusieurs revues d'archeologie a leur production, via la chaine de production editoriale Metopes en XML-TEI. PACTOLS, reservoir commun pour les metadonnees en archeologie et archeoscience, constitue une brique a l'interoperabilite des donnees. Il s'insere aisement dans des systemes simples de bases de donnees ou organises plus puissamment avec des ontologies pour un web des donnees liees.

  • French
    Authors: 
    Angela Cossu;
    Publisher: HAL CCSD
    Country: France

    International audience

  • French
    Authors: 
    Guichard, Éric;
    Publisher: HAL CCSD
    Country: France

    International audience

  • Publication . Part of book or chapter of book . 2019
    French
    Authors: 
    Bergounioux, Gabriel;
    Publisher: HAL CCSD
    Country: France

    International audience; A la distinction traditionnelle entre transcription (traduction généralement alphabétique d'une donnée langagière orale) et annotation (enrichissement par un système de marques du texte obtenu par transcription), cet article substitue une prise en compte de la transcription comme première annotation, que ce soit dans les choix qui sont faits pour l'écriture des mots, leur séparation, l'usage de la ponctuation et des majuscules etc.

  • Open Access French
    Authors: 
    Gruson-Daniel Célya;
    Publisher: HAL CCSD
    Country: France

    Cette recherche prend la forme d’une enquête au sein des milieux de production des savoirs français contemporains et vise à comprendre les différentes significations du terme open en sciences. J’ai considéré le qualificatif open comme une formule. L’analyse de ses traductions en français (ouvert, libre, gratuit), tout autant que des noms qui lui sont associés (science, data, access), constitue le fil directeur de mon étude. Cette enquête, qui a débuté en 2013, s’est surtout centrée sur un évènement particulier, la consultation sur le projet de loi pour une République numérique (septembre-octobre 2015), en particulier l’article 9 sur « le libre accès aux publications scientifiques de la recherche publique ». Cette consultation en ligne a donné une envergure nationale et publique aux problématiques d’accès aux savoirs. En tant qu’épreuve de réalité « équipée » d’un dispositif numérique participatif, elle a été l’occasion d’observer presque « en direct » la défense de différentes conceptions de « ce que devrait être » le régime contemporain des savoirs en France. M’inscrivant dans une démarche par théorisation ancrée, j’ai constitué progressivement, à propos de ce moment particulier de cristallisation des débats sur l’open en sciences, un corpus de documents reflétant le déploiement des échanges sur des espaces/dispositifs numériques distincts : site web de la consultation, blogs scientifiques, revues académiques, médias « grand public », rapports. Les mouvements itératifs de cette enquête, alliant méthodes numériques (réalisation d’une cartographie de similarité des votes) et analyse qualitative du corpus, tout autant que les concepts théoriques mobilisés à la croisée entre sciences de l’information et de la communication et sociologie pragmatique de la critique, ont donné lieu à une modélisation. Cette dernière expose les perspectives argumentatives et les stratégies dans l’épreuve mises en œuvre par diverses parties prenantes pour faire valoir leurs conceptions. Elle montre qu’elles sont sous-tendues par des logiques que j’ai rattachées à des esprits successifs du régime français des savoirs. Par la suite, en passant de la modélisation à une théorisation transposable à d’autres terrains de recherche, je montre comment, derrière les discours sur l’open, la distinction entre deux logiques (technoindustrielle ou processuelle) peut être pertinente pour analyser les reconfigurations actuelles d’autres agencements sociétaux. Les stratégies dans l’épreuve employées lors de la consultation illustrent dans ce sens la coexistence de deux conceptions « numériques » de la démocratie (représentative étendue ou contributive), présentes dans le design même de la plateforme consultative. Dans la dernière partie, je propose d’expliquer les dynamiques de reconfiguration d’un esprit et d’un agencement sociétal dans une interprétation énactive en considérant les couplages permanents entre cognition, actions médiées par les technologies et environnement sociotechnique. L’expérience même du doctorat narrée tout au long de ce récit constitue aussi l’exemple d’un processus d’énaction sur mes propres conceptions de l’open. En ce sens, elle ouvre une piste de réflexion sur la nature située et incarnée de toute production de savoirs, qui n'échappe pas aux limites tout autant qu’aux potentialités de la métacognition. THE FRENCH REGIME OF KNOWLEDGES AND ITS DYNAMICS: OPEN IN SCIENCES AND DIGITAL TECHNOLOGIES IN DEBATE. THE CASE STUDY OF THE FRENCH BILL FOR A "DIGITAL REPUBLIC" (2015) This research investigates the worlds of contemporary French knowledge production in order to understand the different meanings of the term 'open' in sciences. Specific attention has been drawn to the qualifying adjective 'open' in relation to the French translations (ouvert, libre gratuit) as well as associated terms (science, data, access) with this formula. This inquiry began in 2013 and focused mainly on a specific event, the consultation on the bill for a "Digital Republic" (September-October 2015), in particular Article 9 on "open access to scientific publications in public research". This online consultation has allowed for a national and public scope to the issue of access to knowledges. As an "equipped" reality test via a participative website, arose the opportunity to observe almost "live" the defense of different conceptions of "what should be" the contemporary regime of knowledges in France. Through a grounded theory approach around this particular crystallisation moment of the debates on open in sciences has led me to gradually constitute a corpus of documents, reflecting the deployment of the exchanges on different digital spaces/apparatus (consultation website, scientific blogs, academic notebooks, mainstream press, etc.). Within an iterative research process, I combined digital methods (digital mapping of the similarity of votes) and qualitative analysis of the corpus, as well as the theoretical concepts mobilized at the crossroads between information and communication sciences and "pragmatic sociology of critique". This enabled the development of a model which shows that the argumentative perspectives and the strategies in the test implemented by various stakeholders to promote their own conceptions are underpinned by logics, which I have attached to "spirits" of the French regime of knowledges. Subsequently, by switching from modeling to transposable theorization into other fields of research, I show how the distinction between two logics (technoindustrial or processual), behind the discourses on open, can be relevant to analyze the current reconfigurations of other "societal arrangements". The consultation by itself illustrates this point with the coexistence of two "digital" conceptions of democracy (extended representative or contributive), embodied in the design of the consultative platform. In the last part, I propose to explain the dynamics between the reconfiguration of a spirit and its social arrangement, by considering the permanent coupling between cognition, technologically mediated actions and socio-technical environment. Finally, the PhD experience narrated throughout this inquiry is also an example of an enaction process on my own conceptions of open. In this sense, it opens further reflections on the situated and incarnated nature of any production of knowledges, which escapes neither the limits nor the potentialities of metacognition. Keywords: open, regime of knowledges, democracy, debate, digital technologies, enaction

  • French
    Authors: 
    Masclet De Barbarin, Marie;
    Publisher: HAL CCSD
    Country: France

    International audience; Ce guide de bonnes pratiques éthiques et juridiques pour la diffusion des données en SHS est né de la réflexion d’un groupe de chercheurs, de professionnels de la documentation et de juristes structuré dans le cadre d’un groupe de travail Éthique et Droit. Face au renouvellement des problématiques liées aux droits d’auteurs, à la confidentialité, à la sécurisation et à la validation des données dans un contexte de mutation technologique, le groupe de travail Éthique et Droit a lancé un appel à communication ouvert à toutes les personnes s’intéressant aux problématiques éthiques et juridiques en matière de diffusion des données en SHS. Les auteurs ont été invités à proposer soit des retours d’expériences soit des articles portant sur les enjeux éthiques et juridiques en matière de diffusion des données en SHS, en explorant les solutions concrètes envisageables ou envisagées dans le cadre des cinq étapes de diffusion identifiées au préalable : la préparation de la recherche et l’anticipation de l’archivage ; la collecte des données ; le traitement, l’archivage et la description des données ; la diffusion des résultats de la recherche et la réutilisation des données.Il est important ici de souligner le caractère ambitieux de la démarche, à la fois prospective et réflexive, empirique et comparative, et surtout résolument pragmatique. Ce projet, labellisé par la Digital Research Infrastructure for the Arts and Humanities (DARIAH) en 2015 et financé par le Service commun de documentation (SCD) d’AMU, par la MMSH et par le consortium des ethnologues de la Très Grande Infrastructure de recherche (TGIR) Huma-Num a été supervisé par un comité scientifique qui s’est porté garant de la rigueur scientifique de la démarche.