Advanced search in Research products
Research products
arrow_drop_down
Searching FieldsTerms
Any field
arrow_drop_down
includes
arrow_drop_down
Include:
The following results are related to DARIAH EU. Are you interested to view more results? Visit OpenAIRE - Explore.
26 Research products, page 1 of 3

  • DARIAH EU
  • Open Access
  • French

10
arrow_drop_down
Date (most recent)
arrow_drop_down
  • Publication . Doctoral thesis . Other literature type . 2020
    Open Access French
    Authors: 
    Gianola, Lucie;
    Publisher: HAL CCSD
    Country: France

    L'analyse criminelle est une discipline d'appui aux enquêtes pratiquée au sein de la Gendarmerie Nationale. Elle repose sur l'exploitation des documents compilés dans le dossier de procédure judiciaire (auditions, perquisitions, rapports d'expertise, données téléphoniques et bancaires, etc.) afin de synthétiser les informations collectées et de proposer un regard neuf sur les faits examinés. Si l'analyse criminelle a recours à des logiciels de visualisation de données (i. e. Analyst's Notebook d'IBM) pour la mise en forme des hypothèses formulées, la gestion informatique et textuelle des documents de la procédure est entièrement manuelle. Or, l'analyse criminelle s'appuie entre autres sur le concept d'entités pour formaliser son travail. La présentation du contexte de recherche détaille la pratique de l'analyse criminelle ainsi que la constitution du dossier de procédure judiciaire en tant que corpus textuel. Nous proposons ensuite des perspectives pour l'adaptation des méthodes de traitement automatique de la langue (TAL) et d'extraction d'information au cas d'étude, notamment la mise en parallèle des concepts d'entité en analyse criminelle et d'entité nommée en TAL. Cette comparaison est réalisée sur les plans conceptuels et linguistiques. Une première approche de détection des entités dans les auditions de témoins est présentée. Enfin, le genre textuel étant un paramètre à prendre en compte lors de l'application de traitements automatiques à du texte, nous construisons une structuration du genre textuel « légal » en discours, genres et sous-genres par le biais d'une étude textométrique visant à caractériser différents types de textes (dont les auditions de témoins) produits par le domaine de la justice. Criminal analysis is a discipline that supports investigations practiced within the National Gendarmerie. It is based on the use of the documents compiled in the judicial procedure file (witness interviews, search warrants, expert reports, phone and bank data, etc.) to synthesize the information collected and to propose a new understanding of the facts examined. While criminal analysis uses data visualization software (i. e. IBM Analyst's Notebook) to display the hypotheses formulated, the digital and textual management of the file documents is entirely manual. However, criminal analysis relies on entities to formalize its practice. The presentation of the research context details the practice of criminal analysis as well as the constitution of judicial procedure files as textual corpora. We then propose perspectives for the adaptation of natural language processing (NLP) and information extraction methods to the case study, including a comparison of the concepts of entity in criminal analysis and named entity in NLP. This comparison is done on the conceptual and linguistic plans. A first approach to the detection of entities in witness interviews is presented. Finally, since textual genre is a parameter to be taken into account when applying automatic processing to text, we develop a structure of the 'legal' textual genre into discourse, genres, and sub-genres through a textometric study aimed at characterizing different types of texts (including witness interviews) produced by the field of justice.

  • Open Access French
    Authors: 
    Pascal Cuxac; Alain Collignon; Stéphanie Gregorio; François Parmentier;
    Publisher: HAL CCSD
    Country: France

    Dans cet article nous présentons une approche automatique visant à désambiguïser et aligner des entités géographiques de type placeName. Une méthode basée sur des plongements lexicaux permet, à partir d'un apprentissage non supervisé de lever l'ambiguïté face à un terme polysémique. Cela permet alors un alignement automatique avec différents réservoirs (BNF, wikidata…) possédant un triplestore. Nous utilisons alors les technologies du web sémantique, pour à la fois exposer les données de façon différente (data.istex) mais également autoriser des requêtes complexes impossibles à résoudre à partir de moteurs de recherche classiques. Nous aborderons un cas concret basé sur le réservoir ISTEX, et une évaluation qualitative de la méthode sera proposée. In this paper we present an automatic approach to disambiguate and align geographic entities. A method based on word embeddings allows, from unsupervised learning, to remove ambiguity with polysemic terms. This allows automatic alignment with different databases (BNF, wikidata...) having a triplestore. We then use semantic web technologies, both to expose the data in a different way (data.istex) but also to allow complex queries that cannot be solved from traditional search engines. We will discuss a concrete case based on the ISTEX database, and a qualitative evaluation of the method will be proposed.

  • Publication . Other literature type . Article . Conference object . 2019
    Open Access French
    Authors: 
    Blandine Nouvel;
    Publisher: HAL CCSD
    Country: France

    Cree par le reseau Frantiq (Federation et Ressources sur l'Antiquite), initialement pour l'indexation documentaire de la litterature scientifique, PACTOLS est un reservoir unique de metadonnees thematiques reserve a l'archeologie. Le gestionnaire de thesaurus sur lequel il s'appuie, Opentheso, lui confere en outre des capacites techniques d'ouverture et d'interoperabilite qui completent sa normalisation. De plus, l'attribution d'un identifiant perenne a chaque concept fait de chacun un objet web, reperable et citable. PACTOLS constitue ainsi, de fait, un vocabulaire pivot qui repond aux standards du web semantique et de la science ouverte. Il respecte les principes FAIR : il est consultable et accessible librement en ligne, il est interoperable et reutilisable. Ses caracteristiques lexicales et normatives representent un outil au potentiel rare, propose aujourd'hui a tous les acteurs de l'archeologie. Le projet de developpement des PACTOLS, conduit dans le cadre du Consortium MASA de la Tres Grande Infrastructure de Recherche Huma-Num, est destine a offrir a la communaute des archeologues un vocabulaire de reference qui facilite le partage, sur le web, des donnees et des productions scientifiques en archeologie. Il s'oriente dans deux directions : il s'agit d'une part de consolider la structure semantique qui aboutit a la reorganisation des domaines, facilitant la navigation dans le thesaurus. D'autre part, les contenus terminologiques sont enrichis, notamment par l'ajout de vocabulaires de specialites et par l'alignement avec des vocabulaires et des programmes scientifiques du domaine, presents sur le web. La reorganisation du thesaurus se conduit en etroite collaboration avec les experts concernes. Pour cela, les modalites de contribution dynamique au thesaurus sont elargies a tous les acteurs de la discipline, sur la base de niveaux d'autorisation specifiques. Une communaute elargie s'organise, formee et accompagnee a la prise en main partagee du thesaurus. Car PACTOLS, comme vocabulaire de reference, est preconise des le traitement des donnees de fouilles, par exemple a l'Inrap. Il est aussi associe a des programmes de valorisation des donnees de la recherche et integre par plusieurs revues d'archeologie a leur production, via la chaine de production editoriale Metopes en XML-TEI. PACTOLS, reservoir commun pour les metadonnees en archeologie et archeoscience, constitue une brique a l'interoperabilite des donnees. Il s'insere aisement dans des systemes simples de bases de donnees ou organises plus puissamment avec des ontologies pour un web des donnees liees.

  • Open Access French
    Authors: 
    Angela Cossu;
    Publisher: HAL CCSD
    Country: France

    International audience

  • Open Access French
    Authors: 
    Fromageot-Lanièpce, Virginie;
    Publisher: CNR - Istituto di Scienze del Patrimonio Culturale

    The 12th Supplement to the international open access journal ‘Archeologia e Calcolatori’ is dedicated to the history of archaeological research in the digital age, with particular reference to the evolution of electronic publishing from 1955 until today. In the first part of the volume, the Author, Ingénieur de recherche at the CNRS (équipe ArScAn - Monde grec et systèmes d'information), focuses on the history of applications in France in the second half of the 20th century, starting from the earliest experiments of classification and automation of documentary analysis, which then led to the creation of archaeological databases. The second part of the volume examines the development of electronic publishing in archaeology, with particular reference to the changes brought about by the advent of the Internet and the Open Access movement. Through a careful evaluation of the websites of reference for the dissemination of monographs and journals, the analysis focuses on the different digitization and online dissemination policies for archaeological publications. The results of this systematic survey offer a series of interesting ideas to better understand and satisfy the needs of the archaeological community.

  • Open Access French
    Authors: 
    Gruson-Daniel, Célya;
    Publisher: HAL CCSD
    Country: France

    Cette recherche prend la forme d’une enquête au sein des milieux de production des savoirs français contemporainset vise à comprendre les différentes significations du terme open en sciences. J’ai considéré le qualificatif open comme une formule. L’analyse de ses traductions en français (ouvert, libre, gratuit), tout autant que des noms qui lui sont associés (science, data, access), constitue le fil directeur de mon étude. Cette enquête, qui a débuté en 2013, s’est surtout centrée sur un évènement particulier, la consultation sur le projet de loi pour une République numérique (septembre octobre 2015), en particulier l’article 9 sur « le libre accès aux publications scientifiques de la recherche publique ».Cette consultation en ligne a donné une envergure nationale et publique aux problématiques d’accès aux savoirs. Entant qu’épreuve de réalité « équipée » d’un dispositif numérique participatif, elle a été l’occasion d’observer presque« en direct » la défense de différentes conceptions de « ce que devrait être » le régime contemporain des savoirs enFrance.M’inscrivant dans une démarche par théorisation ancrée, j’ai constitué progressivement, à propos de ce momentparticulier de cristallisation des débats sur l’open en sciences, un corpus de documents reflétant le déploiement deséchanges sur des espaces/dispositifs numériques distincts : site web de la consultation, blogs scientifiques, revuesacadémiques, médias « grand public », rapports. Les mouvements itératifs de cette enquête, alliant méthodesnumériques (réalisation d’une cartographie de similarité des votes) et analyse qualitative du corpus, tout autant que les concepts théoriques mobilisés à la croisée entre sciences de l’information et de la communication et sociologiepragmatique de la critique, ont donné lieu à une modélisation.Cette dernière expose les perspectives argumentatives et les stratégies dans l’épreuve mises en oeuvre par diversesparties prenantes pour faire valoir leurs conceptions. Elle montre qu’elles sont sous-tendues par des logiques que j’airattachées à des esprits successifs du régime français des savoirs. Par la suite, en passant de la modélisation à unethéorisation transposable à d’autres terrains de recherche, je montre comment, derrière les discours sur l’open, ladistinction entre deux logiques (technoindustrielle ou processuelle) peut être pertinente pour analyser lesreconfigurations actuelles d’autres agencements sociétaux. Les stratégies dans l’épreuve employées lors de laconsultation illustrent dans ce sens la coexistence de deux conceptions « numériques » de la démocratie (représentative étendue ou contributive), présentes dans le design même de la plateforme consultative.Dans la dernière partie, je propose d’expliquer les dynamiques de reconfiguration d’un esprit et d’un agencementsociétal dans une interprétation énactive en considérant les couplages permanents entre cognition, actions médiées par les technologies et environnement sociotechnique. L’expérience même du doctorat narrée tout au long de ce récitconstitue aussi l’exemple d’un processus d’énaction sur mes propres conceptions de l’open. En ce sens, elle ouvre une piste de réflexion sur la nature située et incarnée de toute production de savoirs, qui n'échappe pas aux limites tout autant qu’aux potentialités de la métacognition. This research investigates the worlds of contemporary French knowledge production in order to understand thedifferent meanings of the term ‘open’ in sciences. Specific attention has been drawn to the qualifying adjective ‘open’in relation to the French translations (ouvert, libre gratuit) as well as associated terms (science, data, access) with thisformula. This inquiry began in 2013 and focused mainly on a specific event, the consultation on the bill for a “DigitalRepublic” (September-October 2015), in particular Article 9 on "open access to scientific publications in publicresearch". This online consultation has allowed for a national and public scope to the issue of access to knowledges.As an “equipped” reality test via a participative website, arose the opportunity to observe almost "live" the defense ofdifferent conceptions of "what should be" the contemporary regime of knowledges in France.Through a grounded theory approach around this particular crystallisation moment of the debates on open in scienceshas led me to gradually constitute a corpus of documents, reflecting the deployment of the exchanges on differentdigital spaces/apparatus (consultation website, scientific blogs, academic notebooks, mainstream press, etc.). Withinan iterative research process, I combined digital methods (digital mapping of the similarity of votes) and qualitativeanalysis of the corpus, as well as the theoretical concepts mobilized at the crossroads between information andcommunication sciences and “pragmatic sociology of critique”.This enabled the development of a model which shows that the argumentative perspectives and the strategies in thetest implemented by various stakeholders to promote their own conceptions are underpinned by logics, which I haveattached to “spirits” of the French regime of knowledges. Subsequently, by switching from modeling to transposabletheorization into other fields of research, I show how the distinction between two logics (technoindustrial orprocessual), behind the discourses on open, can be relevant to analyze the current reconfigurations of other “societalarrangements”. The consultation by itself illustrates this point with the coexistence of two "digital" conceptions ofdemocracy (extended representative or contributive), embodied in the design of the consultative platform.In the last part, I propose to explain the dynamics between the reconfiguration of a spirit and its social arrangement,by considering the permanent coupling between cognition, technologically mediated actions and socio-technicalenvironment. Finally, the PhD experience narrated throughout this inquiry is also an example of an enaction processon my own conceptions of open. In this sense, it opens further reflections on the situated and incarnated nature ofany production of knowledges, which escapes neither the limits nor the potentialities of metacognition.

  • Open Access French
    Authors: 
    Gruson-Daniel, Célya;
    Publisher: Zenodo
    Country: France

    Cette recherche prend la forme d’une enquête au sein des milieux de production des savoirs français contemporains et vise à comprendre les différentes significations du terme open en sciences. J’ai considéré le qualificatif open comme une formule. L’analyse de ses traductions en français (ouvert, libre, gratuit), tout autant que des noms qui lui sont associés (science, data, access), constitue le fil directeur de mon étude. Cette enquête, qui a débuté en 2013, s’est surtout centrée sur un évènement particulier, la consultation sur le projet de loi pour une République numérique (septembre-octobre 2015), en particulier l’article 9 sur « le libre accès aux publications scientifiques de la recherche publique ». Cette consultation en ligne a donné une envergure nationale et publique aux problématiques d’accès aux savoirs. En tant qu’épreuve de réalité « équipée » d’un dispositif numérique participatif, elle a été l’occasion d’observer presque « en direct » la défense de différentes conceptions de « ce que devrait être » le régime contemporain des savoirs en France. M’inscrivant dans une démarche par théorisation ancrée, j’ai constitué progressivement, à propos de ce moment particulier de cristallisation des débats sur l’open en sciences, un corpus de documents reflétant le déploiement des échanges sur des espaces/dispositifs numériques distincts : site web de la consultation, blogs scientifiques, revues académiques, médias « grand public », rapports. Les mouvements itératifs de cette enquête, alliant méthodes numériques (réalisation d’une cartographie de similarité des votes) et analyse qualitative du corpus, tout autant que les concepts théoriques mobilisés à la croisée entre sciences de l’information et de la communication et sociologie pragmatique de la critique, ont donné lieu à une modélisation. Cette dernière expose les perspectives argumentatives et les stratégies dans l’épreuve mises en œuvre par diverses parties prenantes pour faire valoir leurs conceptions. Elle montre qu’elles sont sous-tendues par des logiques que j’ai rattachées à des esprits successifs du régime français des savoirs. Par la suite, en passant de la modélisation à une théorisation transposable à d’autres terrains de recherche, je montre comment, derrière les discours sur l’open, la distinction entre deux logiques (technoindustrielle ou processuelle) peut être pertinente pour analyser les reconfigurations actuelles d’autres agencements sociétaux. Les stratégies dans l’épreuve employées lors de la consultation illustrent dans ce sens la coexistence de deux conceptions « numériques » de la démocratie (représentative étendue ou contributive), présentes dans le design même de la plateforme consultative. Dans la dernière partie, je propose d’expliquer les dynamiques de reconfiguration d’un esprit et d’un agencement sociétal dans une interprétation énactive en considérant les couplages permanents entre cognition, actions médiées par les technologies et environnement sociotechnique. L’expérience même du doctorat narrée tout au long de ce récit constitue aussi l’exemple d’un processus d’énaction sur mes propres conceptions de l’open. En ce sens, elle ouvre une piste de réflexion sur la nature située et incarnée de toute production de savoirs, qui n'échappe pas aux limites tout autant qu’aux potentialités de la métacognition. THE FRENCH REGIME OF KNOWLEDGES AND ITS DYNAMICS: OPEN IN SCIENCES AND DIGITAL TECHNOLOGIES IN DEBATE. THE CASE STUDY OF THE FRENCH BILL FOR A "DIGITAL REPUBLIC" (2015) This research investigates the worlds of contemporary French knowledge production in order to understand the different meanings of the term 'open' in sciences. Specific attention has been drawn to the qualifying adjective 'open' in relation to the French translations (ouvert, libre gratuit) as well as associated terms (science, data, access) with this formula. This inquiry began in 2013 and focused mainly on a specific event, the consultation on the bill for a "Digital Republic" (September-October 2015), in particular Article 9 on "open access to scientific publications in public research". This online consultation has allowed for a national and public scope to the issue of access to knowledges. As an "equipped" reality test via a participative website, arose the opportunity to observe almost "live" the defense of different conceptions of "what should be" the contemporary regime of knowledges in France. Through a grounded theory approach around this particular crystallisation moment of the debates on open in sciences has led me to gradually constitute a corpus of documents, reflecting the deployment of the exchanges on different digital spaces/apparatus (consultation website, scientific blogs, academic notebooks, mainstream press, etc.). Within an iterative research process, I combined digital methods (digital mapping of the similarity of votes) and qualitative analysis of the corpus, as well as the theoretical concepts mobilized at the crossroads between information and communication sciences and "pragmatic sociology of critique". This enabled the development of a model which shows that the argumentative perspectives and the strategies in the test implemented by various stakeholders to promote their own conceptions are underpinned by logics, which I have attached to "spirits" of the French regime of knowledges. Subsequently, by switching from modeling to transposable theorization into other fields of research, I show how the distinction between two logics (technoindustrial or processual), behind the discourses on open, can be relevant to analyze the current reconfigurations of other "societal arrangements". The consultation by itself illustrates this point with the coexistence of two "digital" conceptions of democracy (extended representative or contributive), embodied in the design of the consultative platform. In the last part, I propose to explain the dynamics between the reconfiguration of a spirit and its social arrangement, by considering the permanent coupling between cognition, technologically mediated actions and socio-technical environment. Finally, the PhD experience narrated throughout this inquiry is also an example of an enaction process on my own conceptions of open. In this sense, it opens further reflections on the situated and incarnated nature of any production of knowledges, which escapes neither the limits nor the potentialities of metacognition. Keywords: open, regime of knowledges, democracy, debate, digital technologies, enaction

  • Open Access French
    Authors: 
    LAKEL, Amar; Le Deuff, Olivier;
    Publisher: HAL CCSD
    Country: France

    International audience; This article is based on a web mapping project of the corpus of French language digital humanities. We present here a research methodology based on a new software MyWebIntelligence. We propose a critical analysis of the results from the produced data and from a cartography realized with the software Gephi. This work seeks to show the forces, actors and strategies of visibility in French language digital humanities. We show that two strategies operate in parallel. The more institutional one works in a more top-down fashion, relying in particular on the institutions, while the other works in a bottom-up way by producing a community effect around events such as the ThatCamps and strong personalities. Our work is part of a critical and analytical approach to cartographic methods in order to show the importance of the interpretation of data obtained by the analysis of websites.; Suite au succès des digital humanities dans le monde anglo-saxon, les pays francophones ont connu un engouement similaire pour ce qui fut d’abord un désir d’évolution avant de constituer un véritable champ de recherche. Contemporains et acteurs de ce « mouvement scientifique », nous avons développé une réflexion autant théorique que méthodologique qui a abouti au développement d’un logiciel de constitution d’archives numériques enrichies. Le but de cet article est de tester les méthodes d’analyse réseau et de cartographie des humanités numériques francophones qui s’appuient sur une collecte de documents numériques liés par des liens de citations qualifiés avec le logiciel My Web intelligence. L’objectif est de mettre à l’épreuve notre méthodologie qui vise à faire une sociologie numérique des acteurs à travers leurs stratégies d’éditorialisation. La problématique ici est de comprendre comment le développement de publications en ligne, de nature très hétérogène, peut révéler une spécificité du mouvement francophone des humanités numériques au regard d’une sociologie des sciences humaines. Nous proposons une interprétation des résultats ainsi qu’une réflexion critique quant à la méthodologie employée. Nous mettons en avant le rôle de la communication web pour comprendre les stratégies des acteurs du domaine étudié.

  • Open Access French
    Authors: 
    Massot, Marie-Laure;
    Publisher: HAL CCSD

    Le numérique, environnement technologique des ordinateurs et du réseau, a transformé les méthodes de travail et la publication des résultats scientifiques dans le domaine des sciences humaines et sociales (SHS). Dans ce contexte, le rôle de l’ingénieur(e) SHS est en pleine mutation, à la charnière des humanités et du numérique, voire du design. En pleine transformation des savoirs et des métiers, les profils de soutien à la recherche sont en effet brouillés, ont perdu leurs frontières disciplinaires et cherchent à se redéfinir, à se réinventer. Quels sont les acteurs impliqués dans des projets relevant du champ de humanités numériques ? Quel est le rôle de l’ingénieur SHS dans ce paysage en devenir ? Quelles compétences doit-il acquérir pour faire face au défi du numérique ? Quel pourrait être le profil type d’un ingénieur en « Humanités numériques » ? Quelques pistes de réflexion issues du travail effectué dans le cadre de l’Atelier Digit_Hum « Humanités numériques et valorisation de corpus », axe transversal du CAPHÉS qui soutient scientifiquement et techniquement des projets d’éditions numériques portés par des équipes de l’École normale supérieure et organise des journées annuelles d’étude sur les humanités numériques en collaboration avec le labex TransferS. Parcours illustré par l'artiste Saint-Oma qui dessine les acteurs de ce nouveau type de projets interdisciplinaires.

  • Open Access French
    Authors: 
    Marchand, Joël;
    Publisher: HAL CCSD
    Country: France

    Huma-Num is a Very Large Research Infrastructure (known by its initials in French as TGIR) led by the French Ministry of Higher Education and Research and operated by the CNRS (the French National Centre for Scientific Research).It provides services to the entire Humanities and Social Sciences (HSS) academic community and particularly digital services that are focused on research data management with the aim of helping researchers manage the lifecycle of their data.Huma-Num has designed and provided to the community a new storage service for large volumes (several terabytes) of cold or warm data, so-called because it is rarely accessed or modified, but which does have a high value and therefore needs to be safely secured.How the project was designed, the desired outcomes compared with the previous solution (iRods), the selected solution (Active-Circle software on generally-available hardware), the features of the solution, the network architecture implemented (deployment on RENATER through VPN) and the integration with an LDAP directory will be presented.The collaboration that has been set up with the MSH (Houses of the Human Sciences), the information systems directorates of the affiliated universities and with RENATER will also be described.A progress report on the deployment of the project in seven points of presence in France will be provided, and the project’s development opportunities will be pointed out. Huma-Num est une Très Grande Infrastructure de Recherche (TGIR) pilotée par le Ministère de l'enseigne-ment supérieur et de la recherche, et opérée par le CNRS. Elle rend des services à l'ensemble de la communauté académique en Sciences Humaines et Sociales (SHS) et notamment des services numériques, orientés sur la gestion des données de la recherche, ceci dans le but d'aider les chercheurs à gérer la vie de leurs données. Huma-Num a conçu et proposé à la communauté un nouveau service de stockage nommé Huma-Num Box et destiné aux gros volumes de données (plusieurs To) dites « froides » ou « tièdes », c'est-à-dire peu accédées et modifiées, mais à forte valeur et donc nécessitant une sécurisation importante. Il sera exposé la façon dont le projet a été conçu, les objectifs recherchés par rapport à la solution pré-cédente (iRods), la solution retenue (logiciel Active-Circle sur matériel banalisé), les fonctionnalités de la solution, l'architecture réseau mise en oeuvre (déploiement sur RENATER au travers de VPN) et l'intégra-tion avec un annuaire LDAP. Il sera également indiqué les collaborations qui ont été mises en place avec les Maisons des Sciences de l'Homme (MSH), les DSI des universités de rattachement, et RENATER. Il sera fait un point d'étape sur le déploiement du projet dans 7 points de présence sur le territoire, et indiqué les perspectives d'évolution du projet.

Advanced search in Research products
Research products
arrow_drop_down
Searching FieldsTerms
Any field
arrow_drop_down
includes
arrow_drop_down
Include:
The following results are related to DARIAH EU. Are you interested to view more results? Visit OpenAIRE - Explore.
26 Research products, page 1 of 3
  • Publication . Doctoral thesis . Other literature type . 2020
    Open Access French
    Authors: 
    Gianola, Lucie;
    Publisher: HAL CCSD
    Country: France

    L'analyse criminelle est une discipline d'appui aux enquêtes pratiquée au sein de la Gendarmerie Nationale. Elle repose sur l'exploitation des documents compilés dans le dossier de procédure judiciaire (auditions, perquisitions, rapports d'expertise, données téléphoniques et bancaires, etc.) afin de synthétiser les informations collectées et de proposer un regard neuf sur les faits examinés. Si l'analyse criminelle a recours à des logiciels de visualisation de données (i. e. Analyst's Notebook d'IBM) pour la mise en forme des hypothèses formulées, la gestion informatique et textuelle des documents de la procédure est entièrement manuelle. Or, l'analyse criminelle s'appuie entre autres sur le concept d'entités pour formaliser son travail. La présentation du contexte de recherche détaille la pratique de l'analyse criminelle ainsi que la constitution du dossier de procédure judiciaire en tant que corpus textuel. Nous proposons ensuite des perspectives pour l'adaptation des méthodes de traitement automatique de la langue (TAL) et d'extraction d'information au cas d'étude, notamment la mise en parallèle des concepts d'entité en analyse criminelle et d'entité nommée en TAL. Cette comparaison est réalisée sur les plans conceptuels et linguistiques. Une première approche de détection des entités dans les auditions de témoins est présentée. Enfin, le genre textuel étant un paramètre à prendre en compte lors de l'application de traitements automatiques à du texte, nous construisons une structuration du genre textuel « légal » en discours, genres et sous-genres par le biais d'une étude textométrique visant à caractériser différents types de textes (dont les auditions de témoins) produits par le domaine de la justice. Criminal analysis is a discipline that supports investigations practiced within the National Gendarmerie. It is based on the use of the documents compiled in the judicial procedure file (witness interviews, search warrants, expert reports, phone and bank data, etc.) to synthesize the information collected and to propose a new understanding of the facts examined. While criminal analysis uses data visualization software (i. e. IBM Analyst's Notebook) to display the hypotheses formulated, the digital and textual management of the file documents is entirely manual. However, criminal analysis relies on entities to formalize its practice. The presentation of the research context details the practice of criminal analysis as well as the constitution of judicial procedure files as textual corpora. We then propose perspectives for the adaptation of natural language processing (NLP) and information extraction methods to the case study, including a comparison of the concepts of entity in criminal analysis and named entity in NLP. This comparison is done on the conceptual and linguistic plans. A first approach to the detection of entities in witness interviews is presented. Finally, since textual genre is a parameter to be taken into account when applying automatic processing to text, we develop a structure of the 'legal' textual genre into discourse, genres, and sub-genres through a textometric study aimed at characterizing different types of texts (including witness interviews) produced by the field of justice.

  • Open Access French
    Authors: 
    Pascal Cuxac; Alain Collignon; Stéphanie Gregorio; François Parmentier;
    Publisher: HAL CCSD
    Country: France

    Dans cet article nous présentons une approche automatique visant à désambiguïser et aligner des entités géographiques de type placeName. Une méthode basée sur des plongements lexicaux permet, à partir d'un apprentissage non supervisé de lever l'ambiguïté face à un terme polysémique. Cela permet alors un alignement automatique avec différents réservoirs (BNF, wikidata…) possédant un triplestore. Nous utilisons alors les technologies du web sémantique, pour à la fois exposer les données de façon différente (data.istex) mais également autoriser des requêtes complexes impossibles à résoudre à partir de moteurs de recherche classiques. Nous aborderons un cas concret basé sur le réservoir ISTEX, et une évaluation qualitative de la méthode sera proposée. In this paper we present an automatic approach to disambiguate and align geographic entities. A method based on word embeddings allows, from unsupervised learning, to remove ambiguity with polysemic terms. This allows automatic alignment with different databases (BNF, wikidata...) having a triplestore. We then use semantic web technologies, both to expose the data in a different way (data.istex) but also to allow complex queries that cannot be solved from traditional search engines. We will discuss a concrete case based on the ISTEX database, and a qualitative evaluation of the method will be proposed.

  • Publication . Other literature type . Article . Conference object . 2019
    Open Access French
    Authors: 
    Blandine Nouvel;
    Publisher: HAL CCSD
    Country: France

    Cree par le reseau Frantiq (Federation et Ressources sur l'Antiquite), initialement pour l'indexation documentaire de la litterature scientifique, PACTOLS est un reservoir unique de metadonnees thematiques reserve a l'archeologie. Le gestionnaire de thesaurus sur lequel il s'appuie, Opentheso, lui confere en outre des capacites techniques d'ouverture et d'interoperabilite qui completent sa normalisation. De plus, l'attribution d'un identifiant perenne a chaque concept fait de chacun un objet web, reperable et citable. PACTOLS constitue ainsi, de fait, un vocabulaire pivot qui repond aux standards du web semantique et de la science ouverte. Il respecte les principes FAIR : il est consultable et accessible librement en ligne, il est interoperable et reutilisable. Ses caracteristiques lexicales et normatives representent un outil au potentiel rare, propose aujourd'hui a tous les acteurs de l'archeologie. Le projet de developpement des PACTOLS, conduit dans le cadre du Consortium MASA de la Tres Grande Infrastructure de Recherche Huma-Num, est destine a offrir a la communaute des archeologues un vocabulaire de reference qui facilite le partage, sur le web, des donnees et des productions scientifiques en archeologie. Il s'oriente dans deux directions : il s'agit d'une part de consolider la structure semantique qui aboutit a la reorganisation des domaines, facilitant la navigation dans le thesaurus. D'autre part, les contenus terminologiques sont enrichis, notamment par l'ajout de vocabulaires de specialites et par l'alignement avec des vocabulaires et des programmes scientifiques du domaine, presents sur le web. La reorganisation du thesaurus se conduit en etroite collaboration avec les experts concernes. Pour cela, les modalites de contribution dynamique au thesaurus sont elargies a tous les acteurs de la discipline, sur la base de niveaux d'autorisation specifiques. Une communaute elargie s'organise, formee et accompagnee a la prise en main partagee du thesaurus. Car PACTOLS, comme vocabulaire de reference, est preconise des le traitement des donnees de fouilles, par exemple a l'Inrap. Il est aussi associe a des programmes de valorisation des donnees de la recherche et integre par plusieurs revues d'archeologie a leur production, via la chaine de production editoriale Metopes en XML-TEI. PACTOLS, reservoir commun pour les metadonnees en archeologie et archeoscience, constitue une brique a l'interoperabilite des donnees. Il s'insere aisement dans des systemes simples de bases de donnees ou organises plus puissamment avec des ontologies pour un web des donnees liees.

  • Open Access French
    Authors: 
    Angela Cossu;
    Publisher: HAL CCSD
    Country: France

    International audience

  • Open Access French
    Authors: 
    Fromageot-Lanièpce, Virginie;
    Publisher: CNR - Istituto di Scienze del Patrimonio Culturale

    The 12th Supplement to the international open access journal ‘Archeologia e Calcolatori’ is dedicated to the history of archaeological research in the digital age, with particular reference to the evolution of electronic publishing from 1955 until today. In the first part of the volume, the Author, Ingénieur de recherche at the CNRS (équipe ArScAn - Monde grec et systèmes d'information), focuses on the history of applications in France in the second half of the 20th century, starting from the earliest experiments of classification and automation of documentary analysis, which then led to the creation of archaeological databases. The second part of the volume examines the development of electronic publishing in archaeology, with particular reference to the changes brought about by the advent of the Internet and the Open Access movement. Through a careful evaluation of the websites of reference for the dissemination of monographs and journals, the analysis focuses on the different digitization and online dissemination policies for archaeological publications. The results of this systematic survey offer a series of interesting ideas to better understand and satisfy the needs of the archaeological community.

  • Open Access French
    Authors: 
    Gruson-Daniel, Célya;
    Publisher: HAL CCSD
    Country: France

    Cette recherche prend la forme d’une enquête au sein des milieux de production des savoirs français contemporainset vise à comprendre les différentes significations du terme open en sciences. J’ai considéré le qualificatif open comme une formule. L’analyse de ses traductions en français (ouvert, libre, gratuit), tout autant que des noms qui lui sont associés (science, data, access), constitue le fil directeur de mon étude. Cette enquête, qui a débuté en 2013, s’est surtout centrée sur un évènement particulier, la consultation sur le projet de loi pour une République numérique (septembre octobre 2015), en particulier l’article 9 sur « le libre accès aux publications scientifiques de la recherche publique ».Cette consultation en ligne a donné une envergure nationale et publique aux problématiques d’accès aux savoirs. Entant qu’épreuve de réalité « équipée » d’un dispositif numérique participatif, elle a été l’occasion d’observer presque« en direct » la défense de différentes conceptions de « ce que devrait être » le régime contemporain des savoirs enFrance.M’inscrivant dans une démarche par théorisation ancrée, j’ai constitué progressivement, à propos de ce momentparticulier de cristallisation des débats sur l’open en sciences, un corpus de documents reflétant le déploiement deséchanges sur des espaces/dispositifs numériques distincts : site web de la consultation, blogs scientifiques, revuesacadémiques, médias « grand public », rapports. Les mouvements itératifs de cette enquête, alliant méthodesnumériques (réalisation d’une cartographie de similarité des votes) et analyse qualitative du corpus, tout autant que les concepts théoriques mobilisés à la croisée entre sciences de l’information et de la communication et sociologiepragmatique de la critique, ont donné lieu à une modélisation.Cette dernière expose les perspectives argumentatives et les stratégies dans l’épreuve mises en oeuvre par diversesparties prenantes pour faire valoir leurs conceptions. Elle montre qu’elles sont sous-tendues par des logiques que j’airattachées à des esprits successifs du régime français des savoirs. Par la suite, en passant de la modélisation à unethéorisation transposable à d’autres terrains de recherche, je montre comment, derrière les discours sur l’open, ladistinction entre deux logiques (technoindustrielle ou processuelle) peut être pertinente pour analyser lesreconfigurations actuelles d’autres agencements sociétaux. Les stratégies dans l’épreuve employées lors de laconsultation illustrent dans ce sens la coexistence de deux conceptions « numériques » de la démocratie (représentative étendue ou contributive), présentes dans le design même de la plateforme consultative.Dans la dernière partie, je propose d’expliquer les dynamiques de reconfiguration d’un esprit et d’un agencementsociétal dans une interprétation énactive en considérant les couplages permanents entre cognition, actions médiées par les technologies et environnement sociotechnique. L’expérience même du doctorat narrée tout au long de ce récitconstitue aussi l’exemple d’un processus d’énaction sur mes propres conceptions de l’open. En ce sens, elle ouvre une piste de réflexion sur la nature située et incarnée de toute production de savoirs, qui n'échappe pas aux limites tout autant qu’aux potentialités de la métacognition. This research investigates the worlds of contemporary French knowledge production in order to understand thedifferent meanings of the term ‘open’ in sciences. Specific attention has been drawn to the qualifying adjective ‘open’in relation to the French translations (ouvert, libre gratuit) as well as associated terms (science, data, access) with thisformula. This inquiry began in 2013 and focused mainly on a specific event, the consultation on the bill for a “DigitalRepublic” (September-October 2015), in particular Article 9 on "open access to scientific publications in publicresearch". This online consultation has allowed for a national and public scope to the issue of access to knowledges.As an “equipped” reality test via a participative website, arose the opportunity to observe almost "live" the defense ofdifferent conceptions of "what should be" the contemporary regime of knowledges in France.Through a grounded theory approach around this particular crystallisation moment of the debates on open in scienceshas led me to gradually constitute a corpus of documents, reflecting the deployment of the exchanges on differentdigital spaces/apparatus (consultation website, scientific blogs, academic notebooks, mainstream press, etc.). Withinan iterative research process, I combined digital methods (digital mapping of the similarity of votes) and qualitativeanalysis of the corpus, as well as the theoretical concepts mobilized at the crossroads between information andcommunication sciences and “pragmatic sociology of critique”.This enabled the development of a model which shows that the argumentative perspectives and the strategies in thetest implemented by various stakeholders to promote their own conceptions are underpinned by logics, which I haveattached to “spirits” of the French regime of knowledges. Subsequently, by switching from modeling to transposabletheorization into other fields of research, I show how the distinction between two logics (technoindustrial orprocessual), behind the discourses on open, can be relevant to analyze the current reconfigurations of other “societalarrangements”. The consultation by itself illustrates this point with the coexistence of two "digital" conceptions ofdemocracy (extended representative or contributive), embodied in the design of the consultative platform.In the last part, I propose to explain the dynamics between the reconfiguration of a spirit and its social arrangement,by considering the permanent coupling between cognition, technologically mediated actions and socio-technicalenvironment. Finally, the PhD experience narrated throughout this inquiry is also an example of an enaction processon my own conceptions of open. In this sense, it opens further reflections on the situated and incarnated nature ofany production of knowledges, which escapes neither the limits nor the potentialities of metacognition.

  • Open Access French
    Authors: 
    Gruson-Daniel, Célya;
    Publisher: Zenodo
    Country: France

    Cette recherche prend la forme d’une enquête au sein des milieux de production des savoirs français contemporains et vise à comprendre les différentes significations du terme open en sciences. J’ai considéré le qualificatif open comme une formule. L’analyse de ses traductions en français (ouvert, libre, gratuit), tout autant que des noms qui lui sont associés (science, data, access), constitue le fil directeur de mon étude. Cette enquête, qui a débuté en 2013, s’est surtout centrée sur un évènement particulier, la consultation sur le projet de loi pour une République numérique (septembre-octobre 2015), en particulier l’article 9 sur « le libre accès aux publications scientifiques de la recherche publique ». Cette consultation en ligne a donné une envergure nationale et publique aux problématiques d’accès aux savoirs. En tant qu’épreuve de réalité « équipée » d’un dispositif numérique participatif, elle a été l’occasion d’observer presque « en direct » la défense de différentes conceptions de « ce que devrait être » le régime contemporain des savoirs en France. M’inscrivant dans une démarche par théorisation ancrée, j’ai constitué progressivement, à propos de ce moment particulier de cristallisation des débats sur l’open en sciences, un corpus de documents reflétant le déploiement des échanges sur des espaces/dispositifs numériques distincts : site web de la consultation, blogs scientifiques, revues académiques, médias « grand public », rapports. Les mouvements itératifs de cette enquête, alliant méthodes numériques (réalisation d’une cartographie de similarité des votes) et analyse qualitative du corpus, tout autant que les concepts théoriques mobilisés à la croisée entre sciences de l’information et de la communication et sociologie pragmatique de la critique, ont donné lieu à une modélisation. Cette dernière expose les perspectives argumentatives et les stratégies dans l’épreuve mises en œuvre par diverses parties prenantes pour faire valoir leurs conceptions. Elle montre qu’elles sont sous-tendues par des logiques que j’ai rattachées à des esprits successifs du régime français des savoirs. Par la suite, en passant de la modélisation à une théorisation transposable à d’autres terrains de recherche, je montre comment, derrière les discours sur l’open, la distinction entre deux logiques (technoindustrielle ou processuelle) peut être pertinente pour analyser les reconfigurations actuelles d’autres agencements sociétaux. Les stratégies dans l’épreuve employées lors de la consultation illustrent dans ce sens la coexistence de deux conceptions « numériques » de la démocratie (représentative étendue ou contributive), présentes dans le design même de la plateforme consultative. Dans la dernière partie, je propose d’expliquer les dynamiques de reconfiguration d’un esprit et d’un agencement sociétal dans une interprétation énactive en considérant les couplages permanents entre cognition, actions médiées par les technologies et environnement sociotechnique. L’expérience même du doctorat narrée tout au long de ce récit constitue aussi l’exemple d’un processus d’énaction sur mes propres conceptions de l’open. En ce sens, elle ouvre une piste de réflexion sur la nature située et incarnée de toute production de savoirs, qui n'échappe pas aux limites tout autant qu’aux potentialités de la métacognition. THE FRENCH REGIME OF KNOWLEDGES AND ITS DYNAMICS: OPEN IN SCIENCES AND DIGITAL TECHNOLOGIES IN DEBATE. THE CASE STUDY OF THE FRENCH BILL FOR A "DIGITAL REPUBLIC" (2015) This research investigates the worlds of contemporary French knowledge production in order to understand the different meanings of the term 'open' in sciences. Specific attention has been drawn to the qualifying adjective 'open' in relation to the French translations (ouvert, libre gratuit) as well as associated terms (science, data, access) with this formula. This inquiry began in 2013 and focused mainly on a specific event, the consultation on the bill for a "Digital Republic" (September-October 2015), in particular Article 9 on "open access to scientific publications in public research". This online consultation has allowed for a national and public scope to the issue of access to knowledges. As an "equipped" reality test via a participative website, arose the opportunity to observe almost "live" the defense of different conceptions of "what should be" the contemporary regime of knowledges in France. Through a grounded theory approach around this particular crystallisation moment of the debates on open in sciences has led me to gradually constitute a corpus of documents, reflecting the deployment of the exchanges on different digital spaces/apparatus (consultation website, scientific blogs, academic notebooks, mainstream press, etc.). Within an iterative research process, I combined digital methods (digital mapping of the similarity of votes) and qualitative analysis of the corpus, as well as the theoretical concepts mobilized at the crossroads between information and communication sciences and "pragmatic sociology of critique". This enabled the development of a model which shows that the argumentative perspectives and the strategies in the test implemented by various stakeholders to promote their own conceptions are underpinned by logics, which I have attached to "spirits" of the French regime of knowledges. Subsequently, by switching from modeling to transposable theorization into other fields of research, I show how the distinction between two logics (technoindustrial or processual), behind the discourses on open, can be relevant to analyze the current reconfigurations of other "societal arrangements". The consultation by itself illustrates this point with the coexistence of two "digital" conceptions of democracy (extended representative or contributive), embodied in the design of the consultative platform. In the last part, I propose to explain the dynamics between the reconfiguration of a spirit and its social arrangement, by considering the permanent coupling between cognition, technologically mediated actions and socio-technical environment. Finally, the PhD experience narrated throughout this inquiry is also an example of an enaction process on my own conceptions of open. In this sense, it opens further reflections on the situated and incarnated nature of any production of knowledges, which escapes neither the limits nor the potentialities of metacognition. Keywords: open, regime of knowledges, democracy, debate, digital technologies, enaction

  • Open Access French
    Authors: 
    LAKEL, Amar; Le Deuff, Olivier;
    Publisher: HAL CCSD
    Country: France

    International audience; This article is based on a web mapping project of the corpus of French language digital humanities. We present here a research methodology based on a new software MyWebIntelligence. We propose a critical analysis of the results from the produced data and from a cartography realized with the software Gephi. This work seeks to show the forces, actors and strategies of visibility in French language digital humanities. We show that two strategies operate in parallel. The more institutional one works in a more top-down fashion, relying in particular on the institutions, while the other works in a bottom-up way by producing a community effect around events such as the ThatCamps and strong personalities. Our work is part of a critical and analytical approach to cartographic methods in order to show the importance of the interpretation of data obtained by the analysis of websites.; Suite au succès des digital humanities dans le monde anglo-saxon, les pays francophones ont connu un engouement similaire pour ce qui fut d’abord un désir d’évolution avant de constituer un véritable champ de recherche. Contemporains et acteurs de ce « mouvement scientifique », nous avons développé une réflexion autant théorique que méthodologique qui a abouti au développement d’un logiciel de constitution d’archives numériques enrichies. Le but de cet article est de tester les méthodes d’analyse réseau et de cartographie des humanités numériques francophones qui s’appuient sur une collecte de documents numériques liés par des liens de citations qualifiés avec le logiciel My Web intelligence. L’objectif est de mettre à l’épreuve notre méthodologie qui vise à faire une sociologie numérique des acteurs à travers leurs stratégies d’éditorialisation. La problématique ici est de comprendre comment le développement de publications en ligne, de nature très hétérogène, peut révéler une spécificité du mouvement francophone des humanités numériques au regard d’une sociologie des sciences humaines. Nous proposons une interprétation des résultats ainsi qu’une réflexion critique quant à la méthodologie employée. Nous mettons en avant le rôle de la communication web pour comprendre les stratégies des acteurs du domaine étudié.

  • Open Access French
    Authors: 
    Massot, Marie-Laure;
    Publisher: HAL CCSD

    Le numérique, environnement technologique des ordinateurs et du réseau, a transformé les méthodes de travail et la publication des résultats scientifiques dans le domaine des sciences humaines et sociales (SHS). Dans ce contexte, le rôle de l’ingénieur(e) SHS est en pleine mutation, à la charnière des humanités et du numérique, voire du design. En pleine transformation des savoirs et des métiers, les profils de soutien à la recherche sont en effet brouillés, ont perdu leurs frontières disciplinaires et cherchent à se redéfinir, à se réinventer. Quels sont les acteurs impliqués dans des projets relevant du champ de humanités numériques ? Quel est le rôle de l’ingénieur SHS dans ce paysage en devenir ? Quelles compétences doit-il acquérir pour faire face au défi du numérique ? Quel pourrait être le profil type d’un ingénieur en « Humanités numériques » ? Quelques pistes de réflexion issues du travail effectué dans le cadre de l’Atelier Digit_Hum « Humanités numériques et valorisation de corpus », axe transversal du CAPHÉS qui soutient scientifiquement et techniquement des projets d’éditions numériques portés par des équipes de l’École normale supérieure et organise des journées annuelles d’étude sur les humanités numériques en collaboration avec le labex TransferS. Parcours illustré par l'artiste Saint-Oma qui dessine les acteurs de ce nouveau type de projets interdisciplinaires.

  • Open Access French
    Authors: 
    Marchand, Joël;
    Publisher: HAL CCSD
    Country: France

    Huma-Num is a Very Large Research Infrastructure (known by its initials in French as TGIR) led by the French Ministry of Higher Education and Research and operated by the CNRS (the French National Centre for Scientific Research).It provides services to the entire Humanities and Social Sciences (HSS) academic community and particularly digital services that are focused on research data management with the aim of helping researchers manage the lifecycle of their data.Huma-Num has designed and provided to the community a new storage service for large volumes (several terabytes) of cold or warm data, so-called because it is rarely accessed or modified, but which does have a high value and therefore needs to be safely secured.How the project was designed, the desired outcomes compared with the previous solution (iRods), the selected solution (Active-Circle software on generally-available hardware), the features of the solution, the network architecture implemented (deployment on RENATER through VPN) and the integration with an LDAP directory will be presented.The collaboration that has been set up with the MSH (Houses of the Human Sciences), the information systems directorates of the affiliated universities and with RENATER will also be described.A progress report on the deployment of the project in seven points of presence in France will be provided, and the project’s development opportunities will be pointed out. Huma-Num est une Très Grande Infrastructure de Recherche (TGIR) pilotée par le Ministère de l'enseigne-ment supérieur et de la recherche, et opérée par le CNRS. Elle rend des services à l'ensemble de la communauté académique en Sciences Humaines et Sociales (SHS) et notamment des services numériques, orientés sur la gestion des données de la recherche, ceci dans le but d'aider les chercheurs à gérer la vie de leurs données. Huma-Num a conçu et proposé à la communauté un nouveau service de stockage nommé Huma-Num Box et destiné aux gros volumes de données (plusieurs To) dites « froides » ou « tièdes », c'est-à-dire peu accédées et modifiées, mais à forte valeur et donc nécessitant une sécurisation importante. Il sera exposé la façon dont le projet a été conçu, les objectifs recherchés par rapport à la solution pré-cédente (iRods), la solution retenue (logiciel Active-Circle sur matériel banalisé), les fonctionnalités de la solution, l'architecture réseau mise en oeuvre (déploiement sur RENATER au travers de VPN) et l'intégra-tion avec un annuaire LDAP. Il sera également indiqué les collaborations qui ont été mises en place avec les Maisons des Sciences de l'Homme (MSH), les DSI des universités de rattachement, et RENATER. Il sera fait un point d'étape sur le déploiement du projet dans 7 points de présence sur le territoire, et indiqué les perspectives d'évolution du projet.