search
Include:
The following results are related to DARIAH EU. Are you interested to view more results? Visit OpenAIRE - Explore.
18 Research products, page 1 of 2

  • DARIAH EU
  • Publications
  • Research data
  • 2013-2022
  • Part of book or chapter of book
  • Hyper Article en Ligne - Sciences de l'Homme et de la Société
  • HAL AMU

10
arrow_drop_down
Relevance
arrow_drop_down
  • French
    Authors: 
    Angela Cossu;
    Publisher: HAL CCSD
    Country: France

    International audience

  • Publication . Part of book or chapter of book . 2019
    Open Access English
    Authors: 
    Gelati, Francesco;
    Publisher: HAL CCSD
    Project: EC | EHRI (654164)

    The European Holocaust Research Infrastructure (EHRI) portal website aims to aggregate digitally available archival descriptions concerning the Holocaust. This portal is actually a meta-catalogue, or an information aggregator, whose biggest goal is to have up-to-date information by means of building sustainable data pipelines between EHRI and its content providers. Just like in similar archival information aggregators (e.g. Archives Portal Europe or Monasterium), the XML-based metadata standard Encoded Archival Description (EAD) plays a key role. The article presents how EADs are imported into the portal, mainly thanks to the Open Archive Initiative protocols.

  • French
    Authors: 
    Masclet De Barbarin, Marie;
    Publisher: HAL CCSD
    Country: France

    International audience; Ce guide de bonnes pratiques éthiques et juridiques pour la diffusion des données en SHS est né de la réflexion d’un groupe de chercheurs, de professionnels de la documentation et de juristes structuré dans le cadre d’un groupe de travail Éthique et Droit. Face au renouvellement des problématiques liées aux droits d’auteurs, à la confidentialité, à la sécurisation et à la validation des données dans un contexte de mutation technologique, le groupe de travail Éthique et Droit a lancé un appel à communication ouvert à toutes les personnes s’intéressant aux problématiques éthiques et juridiques en matière de diffusion des données en SHS. Les auteurs ont été invités à proposer soit des retours d’expériences soit des articles portant sur les enjeux éthiques et juridiques en matière de diffusion des données en SHS, en explorant les solutions concrètes envisageables ou envisagées dans le cadre des cinq étapes de diffusion identifiées au préalable : la préparation de la recherche et l’anticipation de l’archivage ; la collecte des données ; le traitement, l’archivage et la description des données ; la diffusion des résultats de la recherche et la réutilisation des données.Il est important ici de souligner le caractère ambitieux de la démarche, à la fois prospective et réflexive, empirique et comparative, et surtout résolument pragmatique. Ce projet, labellisé par la Digital Research Infrastructure for the Arts and Humanities (DARIAH) en 2015 et financé par le Service commun de documentation (SCD) d’AMU, par la MMSH et par le consortium des ethnologues de la Très Grande Infrastructure de recherche (TGIR) Huma-Num a été supervisé par un comité scientifique qui s’est porté garant de la rigueur scientifique de la démarche.

  • French
    Authors: 
    Ginouvès, Véronique; Gras, Isabelle;
    Publisher: HAL CCSD
    Country: France

    International audience; En guise de postface, il nous a semblé nécessaire de revenir sur le processus collaboratif de la fabrication de cet ouvrage et de vous confier la genèse de ce projet. Tout est parti d'un constat pragmatique, de nos situations quotidiennes de travail : le/la chercheur·e qui produit ou utilise des données a besoin de réponses concrètes aux questions auxquelles il/elle est confronté·e sur son terrain comme lors de tous ses travaux de recherche. Produire, exploiter, diffuser, partager ou éditer des sources numériques fait aujourd'hui partie de notre travail ordinaire. La rupture apportée par le développement du web et l'arrivée du format numérique ont largement facilité la diffusion et le partage des ressources (documentaires, textuelles, photographiques, sonores ou audiovisuelles...) dans le monde de la recherche et, au-delà, auprès des citoyens de plus en plus curieux et intéressés par les documents produits par les scientifiques.

  • Open Access
    Authors: 
    Christof Schöch;
    Publisher: Zenodo
    Country: France

    Licence Creative Commons Attribution 4.0 (CC-BY); The digital age, by making large amounts of text available to us, prompts us to develop new and additional reading strategies supported by the use of computers and enabling us to deal with such amounts of text. One such "distant reading" strategy is stylometry, a method of quantitative text analysis which relies on the frequencies of certain linguistic features such as words, letters or grammatical units to statistically assess the relative similarity of texts to each other and to classify texts on this basis. This method is applied here to French drama of the seventeenth century, more precisely to the now famous "Corneille / Molière- controversy". In this controversy, some researchers claim that Pierre Corneille wrote several of the plays traditionally attributed to Molière. The methodological challenge, it is shown here, lies in the fact that categories such as authorship, genre (comedy vs. tragedy) and literary form (prose vs. verse) all have an influence on stylometric distance measures and classification. Cross-genre and cross-form authorship attribution needs to distinguish such competing signals if it is to produce reliable attribution results. This contribution describes two attempts to accomplish this, parameter optimization and feature-range selection. The contribution concludes with some more general remarks about the use of quantitative methods in a hermeneutic discipline such as literary studies.

  • German
    Authors: 
    Baillot, Anne;
    Publisher: HAL CCSD
    Country: France

    International audience; Erläutert wird zuerst, was unter dem Begriff "Digitalisierung" in Bezug auf Briefe zu verstehen ist. Im zweiten Teil wird der theoretische Unterbau vorgestellt. Der dritte Teil führt Fallbeispiele aus.

  • Publication . Part of book or chapter of book . 2017
    Open Access English
    Authors: 
    Laurent Romary; Conny Kristel; Tobias Blanke;
    Publisher: HAL CCSD
    Country: France

    International audience; Humanities have convincingly argued that they need transnational research opportunities and through the digital transformation of their disciplines also have the means to proceed with it on an up to now unknown scale. The digital transformation of research and its resources means that many of the artifacts, documents, materials, etc. that interest humanities research can now be combined in new and innovative ways. Due to the digital transformations, (big) data and information have become central to the study of culture and society. Humanities research infrastructures manage, organise and distribute this kind of information and many more data objects as they becomes relevant for social and cultural research.

  • Publication . Part of book or chapter of book . 2019
    French
    Authors: 
    Bergounioux, Gabriel;
    Publisher: HAL CCSD
    Country: France

    International audience; A la distinction traditionnelle entre transcription (traduction généralement alphabétique d'une donnée langagière orale) et annotation (enrichissement par un système de marques du texte obtenu par transcription), cet article substitue une prise en compte de la transcription comme première annotation, que ce soit dans les choix qui sont faits pour l'écriture des mots, leur séparation, l'usage de la ponctuation et des majuscules etc.

  • French
    Authors: 
    Kunstmann, Pierre; Bozzi, Andrea; Parodi, Giovanni; Pierrel, Jean-Marie; Stein, Achim;
    Publisher: HAL CCSD
    Country: France

    International audience; Quand les organisateurs de notre congrès m’ont demandé, l’an dernier, d’animer la présente table ronde sur lesquestions « Quels corpus et quels outils d’exploitation de corpus », il s’agissait bien entendu dans leur esprit decorpus et d’outils électroniques. Non que les corpus statiques imprimés soient aujourd’hui sans valeur : ils sont encoreutilisés, quoique rarement. J’avoue d’ailleurs avoir commis moi-même un travail de ce genre. Petite anecdote : il y aplus d’une trentaine d’années, ma Concordance analytique de la Mort le Roi Artu, fut publiée aux Éditions del’Université d’Ottawa en 2 gros volumes, soit un total de pas moins de 2000 pages. Le regretté Kurt Baldinger, l’undes phares de la linguistique romane, dans un compte rendu qu’il fit paraître de mes deux volumes dans la revue denotre société, parla de heidenarbeit, travail de bénédictin. L’expression ne manqua pas de me surprendre, car j’avaisalors pris résolument le parti du numérique et je procédai avec une vitesse et une précision que notre confrère n’avaitsans doute pas pu imaginer. Nous assistions alors aux nouvelles Noces de Philologie et de Mercure, à l’ « allianceheureuse du génie informatique et de l'érudition textuelle »1. Les nouvelles technologies ont apporté au linguiste et auphilologue des aides considérables et des perspectives nouvelles, qui peuvent dérouter ou donner le vertige. Si elles nesauraient remplacer le jugement critique de l’expert, celui-ci, de son côté, ne saurait non plus se passer d’elles àchaque étape de sa recherche.

  • Publication . Part of book or chapter of book . Conference object . 2019
    Open Access
    Authors: 
    Elisa Nury;
    Country: Switzerland

    International audience; This paper describes the workflow of the Grammateus project, from gathering data on Greek documentary papyri to the creation of a web application. The first stage is the selection of a corpus and the choice of metadata to record: papyrology specialists gather data from printed editions, existing online resources and digital facsimiles. In the next step, this data is transformed into the EpiDoc standard of XML TEI encoding, to facilitate its reuse by others, and processed for HTML display. We also reuse existing text transcriptions available on . Since these transcriptions may be regularly updated by the scholarly community, we aim to access them dynamically. Although the transcriptions follow the EpiDoc guidelines, the wide diversity of the papyri as well as small inconsistencies in encoding make data reuse challenging. Currently, our data is available on an institutional GitLab repository, and we will archive our final dataset according to the FAIR principles.

search
Include:
The following results are related to DARIAH EU. Are you interested to view more results? Visit OpenAIRE - Explore.
18 Research products, page 1 of 2
  • French
    Authors: 
    Angela Cossu;
    Publisher: HAL CCSD
    Country: France

    International audience

  • Publication . Part of book or chapter of book . 2019
    Open Access English
    Authors: 
    Gelati, Francesco;
    Publisher: HAL CCSD
    Project: EC | EHRI (654164)

    The European Holocaust Research Infrastructure (EHRI) portal website aims to aggregate digitally available archival descriptions concerning the Holocaust. This portal is actually a meta-catalogue, or an information aggregator, whose biggest goal is to have up-to-date information by means of building sustainable data pipelines between EHRI and its content providers. Just like in similar archival information aggregators (e.g. Archives Portal Europe or Monasterium), the XML-based metadata standard Encoded Archival Description (EAD) plays a key role. The article presents how EADs are imported into the portal, mainly thanks to the Open Archive Initiative protocols.

  • French
    Authors: 
    Masclet De Barbarin, Marie;
    Publisher: HAL CCSD
    Country: France

    International audience; Ce guide de bonnes pratiques éthiques et juridiques pour la diffusion des données en SHS est né de la réflexion d’un groupe de chercheurs, de professionnels de la documentation et de juristes structuré dans le cadre d’un groupe de travail Éthique et Droit. Face au renouvellement des problématiques liées aux droits d’auteurs, à la confidentialité, à la sécurisation et à la validation des données dans un contexte de mutation technologique, le groupe de travail Éthique et Droit a lancé un appel à communication ouvert à toutes les personnes s’intéressant aux problématiques éthiques et juridiques en matière de diffusion des données en SHS. Les auteurs ont été invités à proposer soit des retours d’expériences soit des articles portant sur les enjeux éthiques et juridiques en matière de diffusion des données en SHS, en explorant les solutions concrètes envisageables ou envisagées dans le cadre des cinq étapes de diffusion identifiées au préalable : la préparation de la recherche et l’anticipation de l’archivage ; la collecte des données ; le traitement, l’archivage et la description des données ; la diffusion des résultats de la recherche et la réutilisation des données.Il est important ici de souligner le caractère ambitieux de la démarche, à la fois prospective et réflexive, empirique et comparative, et surtout résolument pragmatique. Ce projet, labellisé par la Digital Research Infrastructure for the Arts and Humanities (DARIAH) en 2015 et financé par le Service commun de documentation (SCD) d’AMU, par la MMSH et par le consortium des ethnologues de la Très Grande Infrastructure de recherche (TGIR) Huma-Num a été supervisé par un comité scientifique qui s’est porté garant de la rigueur scientifique de la démarche.

  • French
    Authors: 
    Ginouvès, Véronique; Gras, Isabelle;
    Publisher: HAL CCSD
    Country: France

    International audience; En guise de postface, il nous a semblé nécessaire de revenir sur le processus collaboratif de la fabrication de cet ouvrage et de vous confier la genèse de ce projet. Tout est parti d'un constat pragmatique, de nos situations quotidiennes de travail : le/la chercheur·e qui produit ou utilise des données a besoin de réponses concrètes aux questions auxquelles il/elle est confronté·e sur son terrain comme lors de tous ses travaux de recherche. Produire, exploiter, diffuser, partager ou éditer des sources numériques fait aujourd'hui partie de notre travail ordinaire. La rupture apportée par le développement du web et l'arrivée du format numérique ont largement facilité la diffusion et le partage des ressources (documentaires, textuelles, photographiques, sonores ou audiovisuelles...) dans le monde de la recherche et, au-delà, auprès des citoyens de plus en plus curieux et intéressés par les documents produits par les scientifiques.

  • Open Access
    Authors: 
    Christof Schöch;
    Publisher: Zenodo
    Country: France

    Licence Creative Commons Attribution 4.0 (CC-BY); The digital age, by making large amounts of text available to us, prompts us to develop new and additional reading strategies supported by the use of computers and enabling us to deal with such amounts of text. One such "distant reading" strategy is stylometry, a method of quantitative text analysis which relies on the frequencies of certain linguistic features such as words, letters or grammatical units to statistically assess the relative similarity of texts to each other and to classify texts on this basis. This method is applied here to French drama of the seventeenth century, more precisely to the now famous "Corneille / Molière- controversy". In this controversy, some researchers claim that Pierre Corneille wrote several of the plays traditionally attributed to Molière. The methodological challenge, it is shown here, lies in the fact that categories such as authorship, genre (comedy vs. tragedy) and literary form (prose vs. verse) all have an influence on stylometric distance measures and classification. Cross-genre and cross-form authorship attribution needs to distinguish such competing signals if it is to produce reliable attribution results. This contribution describes two attempts to accomplish this, parameter optimization and feature-range selection. The contribution concludes with some more general remarks about the use of quantitative methods in a hermeneutic discipline such as literary studies.

  • German
    Authors: 
    Baillot, Anne;
    Publisher: HAL CCSD
    Country: France

    International audience; Erläutert wird zuerst, was unter dem Begriff "Digitalisierung" in Bezug auf Briefe zu verstehen ist. Im zweiten Teil wird der theoretische Unterbau vorgestellt. Der dritte Teil führt Fallbeispiele aus.

  • Publication . Part of book or chapter of book . 2017
    Open Access English
    Authors: 
    Laurent Romary; Conny Kristel; Tobias Blanke;
    Publisher: HAL CCSD
    Country: France

    International audience; Humanities have convincingly argued that they need transnational research opportunities and through the digital transformation of their disciplines also have the means to proceed with it on an up to now unknown scale. The digital transformation of research and its resources means that many of the artifacts, documents, materials, etc. that interest humanities research can now be combined in new and innovative ways. Due to the digital transformations, (big) data and information have become central to the study of culture and society. Humanities research infrastructures manage, organise and distribute this kind of information and many more data objects as they becomes relevant for social and cultural research.

  • Publication . Part of book or chapter of book . 2019
    French
    Authors: 
    Bergounioux, Gabriel;
    Publisher: HAL CCSD
    Country: France

    International audience; A la distinction traditionnelle entre transcription (traduction généralement alphabétique d'une donnée langagière orale) et annotation (enrichissement par un système de marques du texte obtenu par transcription), cet article substitue une prise en compte de la transcription comme première annotation, que ce soit dans les choix qui sont faits pour l'écriture des mots, leur séparation, l'usage de la ponctuation et des majuscules etc.

  • French
    Authors: 
    Kunstmann, Pierre; Bozzi, Andrea; Parodi, Giovanni; Pierrel, Jean-Marie; Stein, Achim;
    Publisher: HAL CCSD
    Country: France

    International audience; Quand les organisateurs de notre congrès m’ont demandé, l’an dernier, d’animer la présente table ronde sur lesquestions « Quels corpus et quels outils d’exploitation de corpus », il s’agissait bien entendu dans leur esprit decorpus et d’outils électroniques. Non que les corpus statiques imprimés soient aujourd’hui sans valeur : ils sont encoreutilisés, quoique rarement. J’avoue d’ailleurs avoir commis moi-même un travail de ce genre. Petite anecdote : il y aplus d’une trentaine d’années, ma Concordance analytique de la Mort le Roi Artu, fut publiée aux Éditions del’Université d’Ottawa en 2 gros volumes, soit un total de pas moins de 2000 pages. Le regretté Kurt Baldinger, l’undes phares de la linguistique romane, dans un compte rendu qu’il fit paraître de mes deux volumes dans la revue denotre société, parla de heidenarbeit, travail de bénédictin. L’expression ne manqua pas de me surprendre, car j’avaisalors pris résolument le parti du numérique et je procédai avec une vitesse et une précision que notre confrère n’avaitsans doute pas pu imaginer. Nous assistions alors aux nouvelles Noces de Philologie et de Mercure, à l’ « allianceheureuse du génie informatique et de l'érudition textuelle »1. Les nouvelles technologies ont apporté au linguiste et auphilologue des aides considérables et des perspectives nouvelles, qui peuvent dérouter ou donner le vertige. Si elles nesauraient remplacer le jugement critique de l’expert, celui-ci, de son côté, ne saurait non plus se passer d’elles àchaque étape de sa recherche.

  • Publication . Part of book or chapter of book . Conference object . 2019
    Open Access
    Authors: 
    Elisa Nury;
    Country: Switzerland

    International audience; This paper describes the workflow of the Grammateus project, from gathering data on Greek documentary papyri to the creation of a web application. The first stage is the selection of a corpus and the choice of metadata to record: papyrology specialists gather data from printed editions, existing online resources and digital facsimiles. In the next step, this data is transformed into the EpiDoc standard of XML TEI encoding, to facilitate its reuse by others, and processed for HTML display. We also reuse existing text transcriptions available on . Since these transcriptions may be regularly updated by the scholarly community, we aim to access them dynamically. Although the transcriptions follow the EpiDoc guidelines, the wide diversity of the papyri as well as small inconsistencies in encoding make data reuse challenging. Currently, our data is available on an institutional GitLab repository, and we will archive our final dataset according to the FAIR principles.