search
Include:
The following results are related to DARIAH EU. Are you interested to view more results? Visit OpenAIRE - Explore.
16 Research products, page 1 of 2

  • DARIAH EU
  • Publications
  • Research software
  • 2018-2022
  • French
  • Mémoires en Sciences de l'Information et de la Communication
  • Hyper Article en Ligne - Sciences de l'Homme et de la Société

10
arrow_drop_down
Relevance
arrow_drop_down
  • French
    Authors: 
    Angela Cossu;
    Publisher: HAL CCSD
    Country: France

    International audience

  • French
    Authors: 
    Masclet De Barbarin, Marie;
    Publisher: HAL CCSD
    Country: France

    International audience; Ce guide de bonnes pratiques éthiques et juridiques pour la diffusion des données en SHS est né de la réflexion d’un groupe de chercheurs, de professionnels de la documentation et de juristes structuré dans le cadre d’un groupe de travail Éthique et Droit. Face au renouvellement des problématiques liées aux droits d’auteurs, à la confidentialité, à la sécurisation et à la validation des données dans un contexte de mutation technologique, le groupe de travail Éthique et Droit a lancé un appel à communication ouvert à toutes les personnes s’intéressant aux problématiques éthiques et juridiques en matière de diffusion des données en SHS. Les auteurs ont été invités à proposer soit des retours d’expériences soit des articles portant sur les enjeux éthiques et juridiques en matière de diffusion des données en SHS, en explorant les solutions concrètes envisageables ou envisagées dans le cadre des cinq étapes de diffusion identifiées au préalable : la préparation de la recherche et l’anticipation de l’archivage ; la collecte des données ; le traitement, l’archivage et la description des données ; la diffusion des résultats de la recherche et la réutilisation des données.Il est important ici de souligner le caractère ambitieux de la démarche, à la fois prospective et réflexive, empirique et comparative, et surtout résolument pragmatique. Ce projet, labellisé par la Digital Research Infrastructure for the Arts and Humanities (DARIAH) en 2015 et financé par le Service commun de documentation (SCD) d’AMU, par la MMSH et par le consortium des ethnologues de la Très Grande Infrastructure de recherche (TGIR) Huma-Num a été supervisé par un comité scientifique qui s’est porté garant de la rigueur scientifique de la démarche.

  • French
    Authors: 
    Ginouvès, Véronique; Gras, Isabelle;
    Publisher: HAL CCSD
    Country: France

    International audience; En guise de postface, il nous a semblé nécessaire de revenir sur le processus collaboratif de la fabrication de cet ouvrage et de vous confier la genèse de ce projet. Tout est parti d'un constat pragmatique, de nos situations quotidiennes de travail : le/la chercheur·e qui produit ou utilise des données a besoin de réponses concrètes aux questions auxquelles il/elle est confronté·e sur son terrain comme lors de tous ses travaux de recherche. Produire, exploiter, diffuser, partager ou éditer des sources numériques fait aujourd'hui partie de notre travail ordinaire. La rupture apportée par le développement du web et l'arrivée du format numérique ont largement facilité la diffusion et le partage des ressources (documentaires, textuelles, photographiques, sonores ou audiovisuelles...) dans le monde de la recherche et, au-delà, auprès des citoyens de plus en plus curieux et intéressés par les documents produits par les scientifiques.

  • Publication . Part of book or chapter of book . 2019
    French
    Authors: 
    Bergounioux, Gabriel;
    Publisher: HAL CCSD
    Country: France

    International audience; A la distinction traditionnelle entre transcription (traduction généralement alphabétique d'une donnée langagière orale) et annotation (enrichissement par un système de marques du texte obtenu par transcription), cet article substitue une prise en compte de la transcription comme première annotation, que ce soit dans les choix qui sont faits pour l'écriture des mots, leur séparation, l'usage de la ponctuation et des majuscules etc.

  • Open Access French
    Authors: 
    LAKEL, Amar; Le Deuff, Olivier;
    Publisher: HAL CCSD
    Country: France

    International audience; This article is based on a web mapping project of the corpus of French language digital humanities. We present here a research methodology based on a new software MyWebIntelligence. We propose a critical analysis of the results from the produced data and from a cartography realized with the software Gephi. This work seeks to show the forces, actors and strategies of visibility in French language digital humanities. We show that two strategies operate in parallel. The more institutional one works in a more top-down fashion, relying in particular on the institutions, while the other works in a bottom-up way by producing a community effect around events such as the ThatCamps and strong personalities. Our work is part of a critical and analytical approach to cartographic methods in order to show the importance of the interpretation of data obtained by the analysis of websites.; Suite au succès des digital humanities dans le monde anglo-saxon, les pays francophones ont connu un engouement similaire pour ce qui fut d’abord un désir d’évolution avant de constituer un véritable champ de recherche. Contemporains et acteurs de ce « mouvement scientifique », nous avons développé une réflexion autant théorique que méthodologique qui a abouti au développement d’un logiciel de constitution d’archives numériques enrichies. Le but de cet article est de tester les méthodes d’analyse réseau et de cartographie des humanités numériques francophones qui s’appuient sur une collecte de documents numériques liés par des liens de citations qualifiés avec le logiciel My Web intelligence. L’objectif est de mettre à l’épreuve notre méthodologie qui vise à faire une sociologie numérique des acteurs à travers leurs stratégies d’éditorialisation. La problématique ici est de comprendre comment le développement de publications en ligne, de nature très hétérogène, peut révéler une spécificité du mouvement francophone des humanités numériques au regard d’une sociologie des sciences humaines. Nous proposons une interprétation des résultats ainsi qu’une réflexion critique quant à la méthodologie employée. Nous mettons en avant le rôle de la communication web pour comprendre les stratégies des acteurs du domaine étudié.

  • Open Access French
    Authors: 
    Hélène Prost; Joachim Schöpfel;
    Publisher: HAL CCSD
    Country: France

    International audience; Pour alimenter le débat au sein de la communauté des sciences de l’information de la communication et accompagner l’émergence de la science ouverte, l’article présente les résultats d’une étude empirique sur les dispositifs numériques mis en place par et pour les chercheurs en SIC dans le domaine de la gestion des données de recherche. Quels sont les entrepôts thématiques et disciplinaires des SIC, et quels sont les services génériques d’accueil et de diffusion des données de recherche à disposition des SIC ? Après une analyse conceptuelle des données de recherche et des entrepôts, l’article présente les résultats d’une étude empirique à partir des répertoires Cat-OPIDoR et re3data, en particulier leurs contenus, métadonnées, dimensions disciplinaires et localisation géographique. La discussion porte sur trois aspects : la certification et la normalisation ; la question de la gestion, de l’archivage et/ou la diffusion des données ; et l’impact de la gestion des données sur la communauté des SIC. En guise de conclusion, l’article propose quelques recommandations pour le positionnement des SIC et quelques pistes pour des recherches futures.

  • Open Access French
    Authors: 
    Blandine Nouvel;
    Publisher: HAL CCSD
    Country: France

    Cree par le reseau Frantiq (Federation et Ressources sur l'Antiquite), initialement pour l'indexation documentaire de la litterature scientifique, PACTOLS est un reservoir unique de metadonnees thematiques reserve a l'archeologie. Le gestionnaire de thesaurus sur lequel il s'appuie, Opentheso, lui confere en outre des capacites techniques d'ouverture et d'interoperabilite qui completent sa normalisation. De plus, l'attribution d'un identifiant perenne a chaque concept fait de chacun un objet web, reperable et citable. PACTOLS constitue ainsi, de fait, un vocabulaire pivot qui repond aux standards du web semantique et de la science ouverte. Il respecte les principes FAIR : il est consultable et accessible librement en ligne, il est interoperable et reutilisable. Ses caracteristiques lexicales et normatives representent un outil au potentiel rare, propose aujourd'hui a tous les acteurs de l'archeologie. Le projet de developpement des PACTOLS, conduit dans le cadre du Consortium MASA de la Tres Grande Infrastructure de Recherche Huma-Num, est destine a offrir a la communaute des archeologues un vocabulaire de reference qui facilite le partage, sur le web, des donnees et des productions scientifiques en archeologie. Il s'oriente dans deux directions : il s'agit d'une part de consolider la structure semantique qui aboutit a la reorganisation des domaines, facilitant la navigation dans le thesaurus. D'autre part, les contenus terminologiques sont enrichis, notamment par l'ajout de vocabulaires de specialites et par l'alignement avec des vocabulaires et des programmes scientifiques du domaine, presents sur le web. La reorganisation du thesaurus se conduit en etroite collaboration avec les experts concernes. Pour cela, les modalites de contribution dynamique au thesaurus sont elargies a tous les acteurs de la discipline, sur la base de niveaux d'autorisation specifiques. Une communaute elargie s'organise, formee et accompagnee a la prise en main partagee du thesaurus. Car PACTOLS, comme vocabulaire de reference, est preconise des le traitement des donnees de fouilles, par exemple a l'Inrap. Il est aussi associe a des programmes de valorisation des donnees de la recherche et integre par plusieurs revues d'archeologie a leur production, via la chaine de production editoriale Metopes en XML-TEI. PACTOLS, reservoir commun pour les metadonnees en archeologie et archeoscience, constitue une brique a l'interoperabilite des donnees. Il s'insere aisement dans des systemes simples de bases de donnees ou organises plus puissamment avec des ontologies pour un web des donnees liees.

  • Open Access French
    Authors: 
    Gruson-Daniel, Célya;
    Publisher: HAL CCSD
    Country: France

    Cette recherche prend la forme d’une enquête au sein des milieux de production des savoirs français contemporains et vise à comprendre les différentes significations du terme open en sciences. J’ai considéré le qualificatif open comme une formule. L’analyse de ses traductions en français (ouvert, libre, gratuit), tout autant que des noms qui lui sont associés (science, data, access), constitue le fil directeur de mon étude. Cette enquête, qui a débuté en 2013, s’est surtout centrée sur un évènement particulier, la consultation sur le projet de loi pour une République numérique (septembre-octobre 2015), en particulier l’article 9 sur « le libre accès aux publications scientifiques de la recherche publique ». Cette consultation en ligne a donné une envergure nationale et publique aux problématiques d’accès aux savoirs. En tant qu’épreuve de réalité « équipée » d’un dispositif numérique participatif, elle a été l’occasion d’observer presque « en direct » la défense de différentes conceptions de « ce que devrait être » le régime contemporain des savoirs en France. M’inscrivant dans une démarche par théorisation ancrée, j’ai constitué progressivement, à propos de ce moment particulier de cristallisation des débats sur l’open en sciences, un corpus de documents reflétant le déploiement des échanges sur des espaces/dispositifs numériques distincts : site web de la consultation, blogs scientifiques, revues académiques, médias « grand public », rapports. Les mouvements itératifs de cette enquête, alliant méthodes numériques (réalisation d’une cartographie de similarité des votes) et analyse qualitative du corpus, tout autant que les concepts théoriques mobilisés à la croisée entre sciences de l’information et de la communication et sociologie pragmatique de la critique, ont donné lieu à une modélisation. Cette dernière expose les perspectives argumentatives et les stratégies dans l’épreuve mises en œuvre par diverses parties prenantes pour faire valoir leurs conceptions. Elle montre qu’elles sont sous-tendues par des logiques que j’ai rattachées à des esprits successifs du régime français des savoirs. Par la suite, en passant de la modélisation à une théorisation transposable à d’autres terrains de recherche, je montre comment, derrière les discours sur l’open, la distinction entre deux logiques (technoindustrielle ou processuelle) peut être pertinente pour analyser les reconfigurations actuelles d’autres agencements sociétaux. Les stratégies dans l’épreuve employées lors de la consultation illustrent dans ce sens la coexistence de deux conceptions « numériques » de la démocratie (représentative étendue ou contributive), présentes dans le design même de la plateforme consultative. Dans la dernière partie, je propose d’expliquer les dynamiques de reconfiguration d’un esprit et d’un agencement sociétal dans une interprétation énactive en considérant les couplages permanents entre cognition, actions médiées par les technologies et environnement sociotechnique. L’expérience même du doctorat narrée tout au long de ce récit constitue aussi l’exemple d’un processus d’énaction sur mes propres conceptions de l’open. En ce sens, elle ouvre une piste de réflexion sur la nature située et incarnée de toute production de savoirs, qui n'échappe pas aux limites tout autant qu’aux potentialités de la métacognition. THE FRENCH REGIME OF KNOWLEDGES AND ITS DYNAMICS: OPEN IN SCIENCES AND DIGITAL TECHNOLOGIES IN DEBATE. THE CASE STUDY OF THE FRENCH BILL FOR A "DIGITAL REPUBLIC" (2015) This research investigates the worlds of contemporary French knowledge production in order to understand the different meanings of the term 'open' in sciences. Specific attention has been drawn to the qualifying adjective 'open' in relation to the French translations (ouvert, libre gratuit) as well as associated terms (science, data, access) with this formula. This inquiry began in 2013 and focused mainly on a specific event, the consultation on the bill for a "Digital Republic" (September-October 2015), in particular Article 9 on "open access to scientific publications in public research". This online consultation has allowed for a national and public scope to the issue of access to knowledges. As an "equipped" reality test via a participative website, arose the opportunity to observe almost "live" the defense of different conceptions of "what should be" the contemporary regime of knowledges in France. Through a grounded theory approach around this particular crystallisation moment of the debates on open in sciences has led me to gradually constitute a corpus of documents, reflecting the deployment of the exchanges on different digital spaces/apparatus (consultation website, scientific blogs, academic notebooks, mainstream press, etc.). Within an iterative research process, I combined digital methods (digital mapping of the similarity of votes) and qualitative analysis of the corpus, as well as the theoretical concepts mobilized at the crossroads between information and communication sciences and "pragmatic sociology of critique". This enabled the development of a model which shows that the argumentative perspectives and the strategies in the test implemented by various stakeholders to promote their own conceptions are underpinned by logics, which I have attached to "spirits" of the French regime of knowledges. Subsequently, by switching from modeling to transposable theorization into other fields of research, I show how the distinction between two logics (technoindustrial or processual), behind the discourses on open, can be relevant to analyze the current reconfigurations of other "societal arrangements". The consultation by itself illustrates this point with the coexistence of two "digital" conceptions of democracy (extended representative or contributive), embodied in the design of the consultative platform. In the last part, I propose to explain the dynamics between the reconfiguration of a spirit and its social arrangement, by considering the permanent coupling between cognition, technologically mediated actions and socio-technical environment. Finally, the PhD experience narrated throughout this inquiry is also an example of an enaction process on my own conceptions of open. In this sense, it opens further reflections on the situated and incarnated nature of any production of knowledges, which escapes neither the limits nor the potentialities of metacognition. Keywords: open, regime of knowledges, democracy, debate, digital technologies, enaction

  • French
    Authors: 
    Cuxac, Pascal; Collignon, Alain; Gregorio, Stéphanie; Parmentier, François;
    Publisher: HAL CCSD
    Country: France

    International audience; In this paper we present an automatic approach to disambiguate and align geographic entities. A method based on word embeddings allows, from unsupervised learning, to remove ambiguity with polysemic terms. This allows automatic alignment with different databases (BNF, wikidata...) having a triplestore. We then use semantic web technologies, both to expose the data in a different way (data.istex) but also to allow complex queries that cannot be solved from traditional search engines. We will discuss a concrete case based on the ISTEX database, and a qualitative evaluation of the method will be proposed.; Dans cet article nous présentons une approche automatique visant à désambiguïser et aligner des entités géographiques de type placeName. Une méthode basée sur des plongements lexicaux permet, à partir d'un apprentissage non supervisé de lever l'ambiguïté face à un terme polysémique. Cela permet alors un alignement automatique avec différents réservoirs (BNF, wikidata…) possédant un triplestore. Nous utilisons alors les technologies du web sémantique, pour à la fois exposer les données de façon différente (data.istex) mais également autoriser des requêtes complexes impossibles à résoudre à partir de moteurs de recherche classiques. Nous aborderons un cas concret basé sur le réservoir ISTEX, et une évaluation qualitative de la méthode sera proposée.

  • Open Access French
    Authors: 
    Gianola, Lucie;
    Publisher: HAL CCSD
    Country: France

    L'analyse criminelle est une discipline d'appui aux enquêtes pratiquée au sein de la Gendarmerie Nationale. Elle repose sur l'exploitation des documents compilés dans le dossier de procédure judiciaire (auditions, perquisitions, rapports d'expertise, données téléphoniques et bancaires, etc.) afin de synthétiser les informations collectées et de proposer un regard neuf sur les faits examinés. Si l'analyse criminelle a recours à des logiciels de visualisation de données (i. e. Analyst's Notebook d'IBM) pour la mise en forme des hypothèses formulées, la gestion informatique et textuelle des documents de la procédure est entièrement manuelle. Or, l'analyse criminelle s'appuie entre autres sur le concept d'entités pour formaliser son travail. La présentation du contexte de recherche détaille la pratique de l'analyse criminelle ainsi que la constitution du dossier de procédure judiciaire en tant que corpus textuel. Nous proposons ensuite des perspectives pour l'adaptation des méthodes de traitement automatique de la langue (TAL) et d'extraction d'information au cas d'étude, notamment la mise en parallèle des concepts d'entité en analyse criminelle et d'entité nommée en TAL. Cette comparaison est réalisée sur les plans conceptuels et linguistiques. Une première approche de détection des entités dans les auditions de témoins est présentée. Enfin, le genre textuel étant un paramètre à prendre en compte lors de l'application de traitements automatiques à du texte, nous construisons une structuration du genre textuel « légal » en discours, genres et sous-genres par le biais d'une étude textométrique visant à caractériser différents types de textes (dont les auditions de témoins) produits par le domaine de la justice. Criminal analysis is a discipline that supports investigations practiced within the National Gendarmerie. It is based on the use of the documents compiled in the judicial procedure file (witness interviews, search warrants, expert reports, phone and bank data, etc.) to synthesize the information collected and to propose a new understanding of the facts examined. While criminal analysis uses data visualization software (i. e. IBM Analyst's Notebook) to display the hypotheses formulated, the digital and textual management of the file documents is entirely manual. However, criminal analysis relies on entities to formalize its practice. The presentation of the research context details the practice of criminal analysis as well as the constitution of judicial procedure files as textual corpora. We then propose perspectives for the adaptation of natural language processing (NLP) and information extraction methods to the case study, including a comparison of the concepts of entity in criminal analysis and named entity in NLP. This comparison is done on the conceptual and linguistic plans. A first approach to the detection of entities in witness interviews is presented. Finally, since textual genre is a parameter to be taken into account when applying automatic processing to text, we develop a structure of the 'legal' textual genre into discourse, genres, and sub-genres through a textometric study aimed at characterizing different types of texts (including witness interviews) produced by the field of justice.

search
Include:
The following results are related to DARIAH EU. Are you interested to view more results? Visit OpenAIRE - Explore.
16 Research products, page 1 of 2
  • French
    Authors: 
    Angela Cossu;
    Publisher: HAL CCSD
    Country: France

    International audience

  • French
    Authors: 
    Masclet De Barbarin, Marie;
    Publisher: HAL CCSD
    Country: France

    International audience; Ce guide de bonnes pratiques éthiques et juridiques pour la diffusion des données en SHS est né de la réflexion d’un groupe de chercheurs, de professionnels de la documentation et de juristes structuré dans le cadre d’un groupe de travail Éthique et Droit. Face au renouvellement des problématiques liées aux droits d’auteurs, à la confidentialité, à la sécurisation et à la validation des données dans un contexte de mutation technologique, le groupe de travail Éthique et Droit a lancé un appel à communication ouvert à toutes les personnes s’intéressant aux problématiques éthiques et juridiques en matière de diffusion des données en SHS. Les auteurs ont été invités à proposer soit des retours d’expériences soit des articles portant sur les enjeux éthiques et juridiques en matière de diffusion des données en SHS, en explorant les solutions concrètes envisageables ou envisagées dans le cadre des cinq étapes de diffusion identifiées au préalable : la préparation de la recherche et l’anticipation de l’archivage ; la collecte des données ; le traitement, l’archivage et la description des données ; la diffusion des résultats de la recherche et la réutilisation des données.Il est important ici de souligner le caractère ambitieux de la démarche, à la fois prospective et réflexive, empirique et comparative, et surtout résolument pragmatique. Ce projet, labellisé par la Digital Research Infrastructure for the Arts and Humanities (DARIAH) en 2015 et financé par le Service commun de documentation (SCD) d’AMU, par la MMSH et par le consortium des ethnologues de la Très Grande Infrastructure de recherche (TGIR) Huma-Num a été supervisé par un comité scientifique qui s’est porté garant de la rigueur scientifique de la démarche.

  • French
    Authors: 
    Ginouvès, Véronique; Gras, Isabelle;
    Publisher: HAL CCSD
    Country: France

    International audience; En guise de postface, il nous a semblé nécessaire de revenir sur le processus collaboratif de la fabrication de cet ouvrage et de vous confier la genèse de ce projet. Tout est parti d'un constat pragmatique, de nos situations quotidiennes de travail : le/la chercheur·e qui produit ou utilise des données a besoin de réponses concrètes aux questions auxquelles il/elle est confronté·e sur son terrain comme lors de tous ses travaux de recherche. Produire, exploiter, diffuser, partager ou éditer des sources numériques fait aujourd'hui partie de notre travail ordinaire. La rupture apportée par le développement du web et l'arrivée du format numérique ont largement facilité la diffusion et le partage des ressources (documentaires, textuelles, photographiques, sonores ou audiovisuelles...) dans le monde de la recherche et, au-delà, auprès des citoyens de plus en plus curieux et intéressés par les documents produits par les scientifiques.

  • Publication . Part of book or chapter of book . 2019
    French
    Authors: 
    Bergounioux, Gabriel;
    Publisher: HAL CCSD
    Country: France

    International audience; A la distinction traditionnelle entre transcription (traduction généralement alphabétique d'une donnée langagière orale) et annotation (enrichissement par un système de marques du texte obtenu par transcription), cet article substitue une prise en compte de la transcription comme première annotation, que ce soit dans les choix qui sont faits pour l'écriture des mots, leur séparation, l'usage de la ponctuation et des majuscules etc.

  • Open Access French
    Authors: 
    LAKEL, Amar; Le Deuff, Olivier;
    Publisher: HAL CCSD
    Country: France

    International audience; This article is based on a web mapping project of the corpus of French language digital humanities. We present here a research methodology based on a new software MyWebIntelligence. We propose a critical analysis of the results from the produced data and from a cartography realized with the software Gephi. This work seeks to show the forces, actors and strategies of visibility in French language digital humanities. We show that two strategies operate in parallel. The more institutional one works in a more top-down fashion, relying in particular on the institutions, while the other works in a bottom-up way by producing a community effect around events such as the ThatCamps and strong personalities. Our work is part of a critical and analytical approach to cartographic methods in order to show the importance of the interpretation of data obtained by the analysis of websites.; Suite au succès des digital humanities dans le monde anglo-saxon, les pays francophones ont connu un engouement similaire pour ce qui fut d’abord un désir d’évolution avant de constituer un véritable champ de recherche. Contemporains et acteurs de ce « mouvement scientifique », nous avons développé une réflexion autant théorique que méthodologique qui a abouti au développement d’un logiciel de constitution d’archives numériques enrichies. Le but de cet article est de tester les méthodes d’analyse réseau et de cartographie des humanités numériques francophones qui s’appuient sur une collecte de documents numériques liés par des liens de citations qualifiés avec le logiciel My Web intelligence. L’objectif est de mettre à l’épreuve notre méthodologie qui vise à faire une sociologie numérique des acteurs à travers leurs stratégies d’éditorialisation. La problématique ici est de comprendre comment le développement de publications en ligne, de nature très hétérogène, peut révéler une spécificité du mouvement francophone des humanités numériques au regard d’une sociologie des sciences humaines. Nous proposons une interprétation des résultats ainsi qu’une réflexion critique quant à la méthodologie employée. Nous mettons en avant le rôle de la communication web pour comprendre les stratégies des acteurs du domaine étudié.

  • Open Access French
    Authors: 
    Hélène Prost; Joachim Schöpfel;
    Publisher: HAL CCSD
    Country: France

    International audience; Pour alimenter le débat au sein de la communauté des sciences de l’information de la communication et accompagner l’émergence de la science ouverte, l’article présente les résultats d’une étude empirique sur les dispositifs numériques mis en place par et pour les chercheurs en SIC dans le domaine de la gestion des données de recherche. Quels sont les entrepôts thématiques et disciplinaires des SIC, et quels sont les services génériques d’accueil et de diffusion des données de recherche à disposition des SIC ? Après une analyse conceptuelle des données de recherche et des entrepôts, l’article présente les résultats d’une étude empirique à partir des répertoires Cat-OPIDoR et re3data, en particulier leurs contenus, métadonnées, dimensions disciplinaires et localisation géographique. La discussion porte sur trois aspects : la certification et la normalisation ; la question de la gestion, de l’archivage et/ou la diffusion des données ; et l’impact de la gestion des données sur la communauté des SIC. En guise de conclusion, l’article propose quelques recommandations pour le positionnement des SIC et quelques pistes pour des recherches futures.

  • Open Access French
    Authors: 
    Blandine Nouvel;
    Publisher: HAL CCSD
    Country: France

    Cree par le reseau Frantiq (Federation et Ressources sur l'Antiquite), initialement pour l'indexation documentaire de la litterature scientifique, PACTOLS est un reservoir unique de metadonnees thematiques reserve a l'archeologie. Le gestionnaire de thesaurus sur lequel il s'appuie, Opentheso, lui confere en outre des capacites techniques d'ouverture et d'interoperabilite qui completent sa normalisation. De plus, l'attribution d'un identifiant perenne a chaque concept fait de chacun un objet web, reperable et citable. PACTOLS constitue ainsi, de fait, un vocabulaire pivot qui repond aux standards du web semantique et de la science ouverte. Il respecte les principes FAIR : il est consultable et accessible librement en ligne, il est interoperable et reutilisable. Ses caracteristiques lexicales et normatives representent un outil au potentiel rare, propose aujourd'hui a tous les acteurs de l'archeologie. Le projet de developpement des PACTOLS, conduit dans le cadre du Consortium MASA de la Tres Grande Infrastructure de Recherche Huma-Num, est destine a offrir a la communaute des archeologues un vocabulaire de reference qui facilite le partage, sur le web, des donnees et des productions scientifiques en archeologie. Il s'oriente dans deux directions : il s'agit d'une part de consolider la structure semantique qui aboutit a la reorganisation des domaines, facilitant la navigation dans le thesaurus. D'autre part, les contenus terminologiques sont enrichis, notamment par l'ajout de vocabulaires de specialites et par l'alignement avec des vocabulaires et des programmes scientifiques du domaine, presents sur le web. La reorganisation du thesaurus se conduit en etroite collaboration avec les experts concernes. Pour cela, les modalites de contribution dynamique au thesaurus sont elargies a tous les acteurs de la discipline, sur la base de niveaux d'autorisation specifiques. Une communaute elargie s'organise, formee et accompagnee a la prise en main partagee du thesaurus. Car PACTOLS, comme vocabulaire de reference, est preconise des le traitement des donnees de fouilles, par exemple a l'Inrap. Il est aussi associe a des programmes de valorisation des donnees de la recherche et integre par plusieurs revues d'archeologie a leur production, via la chaine de production editoriale Metopes en XML-TEI. PACTOLS, reservoir commun pour les metadonnees en archeologie et archeoscience, constitue une brique a l'interoperabilite des donnees. Il s'insere aisement dans des systemes simples de bases de donnees ou organises plus puissamment avec des ontologies pour un web des donnees liees.

  • Open Access French
    Authors: 
    Gruson-Daniel, Célya;
    Publisher: HAL CCSD
    Country: France

    Cette recherche prend la forme d’une enquête au sein des milieux de production des savoirs français contemporains et vise à comprendre les différentes significations du terme open en sciences. J’ai considéré le qualificatif open comme une formule. L’analyse de ses traductions en français (ouvert, libre, gratuit), tout autant que des noms qui lui sont associés (science, data, access), constitue le fil directeur de mon étude. Cette enquête, qui a débuté en 2013, s’est surtout centrée sur un évènement particulier, la consultation sur le projet de loi pour une République numérique (septembre-octobre 2015), en particulier l’article 9 sur « le libre accès aux publications scientifiques de la recherche publique ». Cette consultation en ligne a donné une envergure nationale et publique aux problématiques d’accès aux savoirs. En tant qu’épreuve de réalité « équipée » d’un dispositif numérique participatif, elle a été l’occasion d’observer presque « en direct » la défense de différentes conceptions de « ce que devrait être » le régime contemporain des savoirs en France. M’inscrivant dans une démarche par théorisation ancrée, j’ai constitué progressivement, à propos de ce moment particulier de cristallisation des débats sur l’open en sciences, un corpus de documents reflétant le déploiement des échanges sur des espaces/dispositifs numériques distincts : site web de la consultation, blogs scientifiques, revues académiques, médias « grand public », rapports. Les mouvements itératifs de cette enquête, alliant méthodes numériques (réalisation d’une cartographie de similarité des votes) et analyse qualitative du corpus, tout autant que les concepts théoriques mobilisés à la croisée entre sciences de l’information et de la communication et sociologie pragmatique de la critique, ont donné lieu à une modélisation. Cette dernière expose les perspectives argumentatives et les stratégies dans l’épreuve mises en œuvre par diverses parties prenantes pour faire valoir leurs conceptions. Elle montre qu’elles sont sous-tendues par des logiques que j’ai rattachées à des esprits successifs du régime français des savoirs. Par la suite, en passant de la modélisation à une théorisation transposable à d’autres terrains de recherche, je montre comment, derrière les discours sur l’open, la distinction entre deux logiques (technoindustrielle ou processuelle) peut être pertinente pour analyser les reconfigurations actuelles d’autres agencements sociétaux. Les stratégies dans l’épreuve employées lors de la consultation illustrent dans ce sens la coexistence de deux conceptions « numériques » de la démocratie (représentative étendue ou contributive), présentes dans le design même de la plateforme consultative. Dans la dernière partie, je propose d’expliquer les dynamiques de reconfiguration d’un esprit et d’un agencement sociétal dans une interprétation énactive en considérant les couplages permanents entre cognition, actions médiées par les technologies et environnement sociotechnique. L’expérience même du doctorat narrée tout au long de ce récit constitue aussi l’exemple d’un processus d’énaction sur mes propres conceptions de l’open. En ce sens, elle ouvre une piste de réflexion sur la nature située et incarnée de toute production de savoirs, qui n'échappe pas aux limites tout autant qu’aux potentialités de la métacognition. THE FRENCH REGIME OF KNOWLEDGES AND ITS DYNAMICS: OPEN IN SCIENCES AND DIGITAL TECHNOLOGIES IN DEBATE. THE CASE STUDY OF THE FRENCH BILL FOR A "DIGITAL REPUBLIC" (2015) This research investigates the worlds of contemporary French knowledge production in order to understand the different meanings of the term 'open' in sciences. Specific attention has been drawn to the qualifying adjective 'open' in relation to the French translations (ouvert, libre gratuit) as well as associated terms (science, data, access) with this formula. This inquiry began in 2013 and focused mainly on a specific event, the consultation on the bill for a "Digital Republic" (September-October 2015), in particular Article 9 on "open access to scientific publications in public research". This online consultation has allowed for a national and public scope to the issue of access to knowledges. As an "equipped" reality test via a participative website, arose the opportunity to observe almost "live" the defense of different conceptions of "what should be" the contemporary regime of knowledges in France. Through a grounded theory approach around this particular crystallisation moment of the debates on open in sciences has led me to gradually constitute a corpus of documents, reflecting the deployment of the exchanges on different digital spaces/apparatus (consultation website, scientific blogs, academic notebooks, mainstream press, etc.). Within an iterative research process, I combined digital methods (digital mapping of the similarity of votes) and qualitative analysis of the corpus, as well as the theoretical concepts mobilized at the crossroads between information and communication sciences and "pragmatic sociology of critique". This enabled the development of a model which shows that the argumentative perspectives and the strategies in the test implemented by various stakeholders to promote their own conceptions are underpinned by logics, which I have attached to "spirits" of the French regime of knowledges. Subsequently, by switching from modeling to transposable theorization into other fields of research, I show how the distinction between two logics (technoindustrial or processual), behind the discourses on open, can be relevant to analyze the current reconfigurations of other "societal arrangements". The consultation by itself illustrates this point with the coexistence of two "digital" conceptions of democracy (extended representative or contributive), embodied in the design of the consultative platform. In the last part, I propose to explain the dynamics between the reconfiguration of a spirit and its social arrangement, by considering the permanent coupling between cognition, technologically mediated actions and socio-technical environment. Finally, the PhD experience narrated throughout this inquiry is also an example of an enaction process on my own conceptions of open. In this sense, it opens further reflections on the situated and incarnated nature of any production of knowledges, which escapes neither the limits nor the potentialities of metacognition. Keywords: open, regime of knowledges, democracy, debate, digital technologies, enaction

  • French
    Authors: 
    Cuxac, Pascal; Collignon, Alain; Gregorio, Stéphanie; Parmentier, François;
    Publisher: HAL CCSD
    Country: France

    International audience; In this paper we present an automatic approach to disambiguate and align geographic entities. A method based on word embeddings allows, from unsupervised learning, to remove ambiguity with polysemic terms. This allows automatic alignment with different databases (BNF, wikidata...) having a triplestore. We then use semantic web technologies, both to expose the data in a different way (data.istex) but also to allow complex queries that cannot be solved from traditional search engines. We will discuss a concrete case based on the ISTEX database, and a qualitative evaluation of the method will be proposed.; Dans cet article nous présentons une approche automatique visant à désambiguïser et aligner des entités géographiques de type placeName. Une méthode basée sur des plongements lexicaux permet, à partir d'un apprentissage non supervisé de lever l'ambiguïté face à un terme polysémique. Cela permet alors un alignement automatique avec différents réservoirs (BNF, wikidata…) possédant un triplestore. Nous utilisons alors les technologies du web sémantique, pour à la fois exposer les données de façon différente (data.istex) mais également autoriser des requêtes complexes impossibles à résoudre à partir de moteurs de recherche classiques. Nous aborderons un cas concret basé sur le réservoir ISTEX, et une évaluation qualitative de la méthode sera proposée.

  • Open Access French
    Authors: 
    Gianola, Lucie;
    Publisher: HAL CCSD
    Country: France

    L'analyse criminelle est une discipline d'appui aux enquêtes pratiquée au sein de la Gendarmerie Nationale. Elle repose sur l'exploitation des documents compilés dans le dossier de procédure judiciaire (auditions, perquisitions, rapports d'expertise, données téléphoniques et bancaires, etc.) afin de synthétiser les informations collectées et de proposer un regard neuf sur les faits examinés. Si l'analyse criminelle a recours à des logiciels de visualisation de données (i. e. Analyst's Notebook d'IBM) pour la mise en forme des hypothèses formulées, la gestion informatique et textuelle des documents de la procédure est entièrement manuelle. Or, l'analyse criminelle s'appuie entre autres sur le concept d'entités pour formaliser son travail. La présentation du contexte de recherche détaille la pratique de l'analyse criminelle ainsi que la constitution du dossier de procédure judiciaire en tant que corpus textuel. Nous proposons ensuite des perspectives pour l'adaptation des méthodes de traitement automatique de la langue (TAL) et d'extraction d'information au cas d'étude, notamment la mise en parallèle des concepts d'entité en analyse criminelle et d'entité nommée en TAL. Cette comparaison est réalisée sur les plans conceptuels et linguistiques. Une première approche de détection des entités dans les auditions de témoins est présentée. Enfin, le genre textuel étant un paramètre à prendre en compte lors de l'application de traitements automatiques à du texte, nous construisons une structuration du genre textuel « légal » en discours, genres et sous-genres par le biais d'une étude textométrique visant à caractériser différents types de textes (dont les auditions de témoins) produits par le domaine de la justice. Criminal analysis is a discipline that supports investigations practiced within the National Gendarmerie. It is based on the use of the documents compiled in the judicial procedure file (witness interviews, search warrants, expert reports, phone and bank data, etc.) to synthesize the information collected and to propose a new understanding of the facts examined. While criminal analysis uses data visualization software (i. e. IBM Analyst's Notebook) to display the hypotheses formulated, the digital and textual management of the file documents is entirely manual. However, criminal analysis relies on entities to formalize its practice. The presentation of the research context details the practice of criminal analysis as well as the constitution of judicial procedure files as textual corpora. We then propose perspectives for the adaptation of natural language processing (NLP) and information extraction methods to the case study, including a comparison of the concepts of entity in criminal analysis and named entity in NLP. This comparison is done on the conceptual and linguistic plans. A first approach to the detection of entities in witness interviews is presented. Finally, since textual genre is a parameter to be taken into account when applying automatic processing to text, we develop a structure of the 'legal' textual genre into discourse, genres, and sub-genres through a textometric study aimed at characterizing different types of texts (including witness interviews) produced by the field of justice.