- home
- Search
18 Research products, page 1 of 2
Loading
- Publication . 2019Open AccessAuthors:Angela Cossu;Angela Cossu;Country: France
International audience
- Publication . Part of book or chapter of book . 2019Open Access EnglishAuthors:Gelati, Francesco;Gelati, Francesco;Publisher: HAL CCSDProject: EC | EHRI (654164)
The European Holocaust Research Infrastructure (EHRI) portal website aims to aggregate digitally available archival descriptions concerning the Holocaust. This portal is actually a meta-catalogue, or an information aggregator, whose biggest goal is to have up-to-date information by means of building sustainable data pipelines between EHRI and its content providers. Just like in similar archival information aggregators (e.g. Archives Portal Europe or Monasterium), the XML-based metadata standard Encoded Archival Description (EAD) plays a key role. The article presents how EADs are imported into the portal, mainly thanks to the Open Archive Initiative protocols.
Average popularityAverage popularity In bottom 99%Average influencePopularity: Citation-based measure reflecting the current impact.Average influence In bottom 99%Influence: Citation-based measure reflecting the total impact.add Add to ORCIDPlease grant OpenAIRE to access and update your ORCID works.This Research product is the result of merged Research products in OpenAIRE.
You have already added works in your ORCID record related to the merged Research product. - Publication . 2018FrenchAuthors:Ginouvès, Véronique; Gras, Isabelle;Ginouvès, Véronique; Gras, Isabelle;Publisher: HAL CCSDCountry: France
International audience; En guise de postface, il nous a semblé nécessaire de revenir sur le processus collaboratif de la fabrication de cet ouvrage et de vous confier la genèse de ce projet. Tout est parti d'un constat pragmatique, de nos situations quotidiennes de travail : le/la chercheur·e qui produit ou utilise des données a besoin de réponses concrètes aux questions auxquelles il/elle est confronté·e sur son terrain comme lors de tous ses travaux de recherche. Produire, exploiter, diffuser, partager ou éditer des sources numériques fait aujourd'hui partie de notre travail ordinaire. La rupture apportée par le développement du web et l'arrivée du format numérique ont largement facilité la diffusion et le partage des ressources (documentaires, textuelles, photographiques, sonores ou audiovisuelles...) dans le monde de la recherche et, au-delà, auprès des citoyens de plus en plus curieux et intéressés par les documents produits par les scientifiques.
- Publication . Part of book or chapter of book . 2014Open Access GermanAuthors:Christof Schöch;Christof Schöch;
doi: 10.5281/zenodo.8510
Publisher: HAL CCSDCountry: FranceLicence Creative Commons Attribution 4.0 (CC-BY); The digital age, by making large amounts of text available to us, prompts us to develop new and additional reading strategies supported by the use of computers and enabling us to deal with such amounts of text. One such "distant reading" strategy is stylometry, a method of quantitative text analysis which relies on the frequencies of certain linguistic features such as words, letters or grammatical units to statistically assess the relative similarity of texts to each other and to classify texts on this basis. This method is applied here to French drama of the seventeenth century, more precisely to the now famous "Corneille / Molière- controversy". In this controversy, some researchers claim that Pierre Corneille wrote several of the plays traditionally attributed to Molière. The methodological challenge, it is shown here, lies in the fact that categories such as authorship, genre (comedy vs. tragedy) and literary form (prose vs. verse) all have an influence on stylometric distance measures and classification. Cross-genre and cross-form authorship attribution needs to distinguish such competing signals if it is to produce reliable attribution results. This contribution describes two attempts to accomplish this, parameter optimization and feature-range selection. The contribution concludes with some more general remarks about the use of quantitative methods in a hermeneutic discipline such as literary studies.
Average popularityAverage popularity In bottom 99%Average influencePopularity: Citation-based measure reflecting the current impact.Average influence In bottom 99%Influence: Citation-based measure reflecting the total impact.add Add to ORCIDPlease grant OpenAIRE to access and update your ORCID works.This Research product is the result of merged Research products in OpenAIRE.
You have already added works in your ORCID record related to the merged Research product. - Publication . 2018FrenchAuthors:Masclet De Barbarin, Marie;Masclet De Barbarin, Marie;Publisher: HAL CCSDCountry: France
International audience; Ce guide de bonnes pratiques éthiques et juridiques pour la diffusion des données en SHS est né de la réflexion d’un groupe de chercheurs, de professionnels de la documentation et de juristes structuré dans le cadre d’un groupe de travail Éthique et Droit. Face au renouvellement des problématiques liées aux droits d’auteurs, à la confidentialité, à la sécurisation et à la validation des données dans un contexte de mutation technologique, le groupe de travail Éthique et Droit a lancé un appel à communication ouvert à toutes les personnes s’intéressant aux problématiques éthiques et juridiques en matière de diffusion des données en SHS. Les auteurs ont été invités à proposer soit des retours d’expériences soit des articles portant sur les enjeux éthiques et juridiques en matière de diffusion des données en SHS, en explorant les solutions concrètes envisageables ou envisagées dans le cadre des cinq étapes de diffusion identifiées au préalable : la préparation de la recherche et l’anticipation de l’archivage ; la collecte des données ; le traitement, l’archivage et la description des données ; la diffusion des résultats de la recherche et la réutilisation des données.Il est important ici de souligner le caractère ambitieux de la démarche, à la fois prospective et réflexive, empirique et comparative, et surtout résolument pragmatique. Ce projet, labellisé par la Digital Research Infrastructure for the Arts and Humanities (DARIAH) en 2015 et financé par le Service commun de documentation (SCD) d’AMU, par la MMSH et par le consortium des ethnologues de la Très Grande Infrastructure de recherche (TGIR) Huma-Num a été supervisé par un comité scientifique qui s’est porté garant de la rigueur scientifique de la démarche.
- Publication . Part of book or chapter of book . 2017Open Access EnglishAuthors:Laurent Romary; Conny Kristel; Tobias Blanke;Laurent Romary; Conny Kristel; Tobias Blanke;Publisher: HAL CCSDCountry: France
International audience; Humanities have convincingly argued that they need transnational research opportunities and through the digital transformation of their disciplines also have the means to proceed with it on an up to now unknown scale. The digital transformation of research and its resources means that many of the artifacts, documents, materials, etc. that interest humanities research can now be combined in new and innovative ways. Due to the digital transformations, (big) data and information have become central to the study of culture and society. Humanities research infrastructures manage, organise and distribute this kind of information and many more data objects as they becomes relevant for social and cultural research.
Average popularityAverage popularity In bottom 99%Average influencePopularity: Citation-based measure reflecting the current impact.Average influence In bottom 99%Influence: Citation-based measure reflecting the total impact.add Add to ORCIDPlease grant OpenAIRE to access and update your ORCID works.This Research product is the result of merged Research products in OpenAIRE.
You have already added works in your ORCID record related to the merged Research product. - Publication . Other literature type . Part of book or chapter of book . 2020GermanAuthors:Baillot, Anne;Baillot, Anne;Publisher: HAL CCSDCountry: France
International audience; Erläutert wird zuerst, was unter dem Begriff "Digitalisierung" in Bezug auf Briefe zu verstehen ist. Im zweiten Teil wird der theoretische Unterbau vorgestellt. Der dritte Teil führt Fallbeispiele aus.
- Publication . Other literature type . Part of book or chapter of book . 2019Open Access FrenchAuthors:Bergounioux, Gabriel;Bergounioux, Gabriel;Publisher: HAL CCSDCountry: France
International audience; A la distinction traditionnelle entre transcription (traduction généralement alphabétique d'une donnée langagière orale) et annotation (enrichissement par un système de marques du texte obtenu par transcription), cet article substitue une prise en compte de la transcription comme première annotation, que ce soit dans les choix qui sont faits pour l'écriture des mots, leur séparation, l'usage de la ponctuation et des majuscules etc.
- Publication . 2016FrenchAuthors:Kunstmann, Pierre; Bozzi, Andrea; Parodi, Giovanni; Pierrel, Jean-Marie; Stein, Achim;Kunstmann, Pierre; Bozzi, Andrea; Parodi, Giovanni; Pierrel, Jean-Marie; Stein, Achim;Publisher: HAL CCSDCountry: France
International audience; Quand les organisateurs de notre congrès m’ont demandé, l’an dernier, d’animer la présente table ronde sur lesquestions « Quels corpus et quels outils d’exploitation de corpus », il s’agissait bien entendu dans leur esprit decorpus et d’outils électroniques. Non que les corpus statiques imprimés soient aujourd’hui sans valeur : ils sont encoreutilisés, quoique rarement. J’avoue d’ailleurs avoir commis moi-même un travail de ce genre. Petite anecdote : il y aplus d’une trentaine d’années, ma Concordance analytique de la Mort le Roi Artu, fut publiée aux Éditions del’Université d’Ottawa en 2 gros volumes, soit un total de pas moins de 2000 pages. Le regretté Kurt Baldinger, l’undes phares de la linguistique romane, dans un compte rendu qu’il fit paraître de mes deux volumes dans la revue denotre société, parla de heidenarbeit, travail de bénédictin. L’expression ne manqua pas de me surprendre, car j’avaisalors pris résolument le parti du numérique et je procédai avec une vitesse et une précision que notre confrère n’avaitsans doute pas pu imaginer. Nous assistions alors aux nouvelles Noces de Philologie et de Mercure, à l’ « allianceheureuse du génie informatique et de l'érudition textuelle »1. Les nouvelles technologies ont apporté au linguiste et auphilologue des aides considérables et des perspectives nouvelles, qui peuvent dérouter ou donner le vertige. Si elles nesauraient remplacer le jugement critique de l’expert, celui-ci, de son côté, ne saurait non plus se passer d’elles àchaque étape de sa recherche.
- Publication . Part of book or chapter of book . 2019Open Access EnglishAuthors:Elisa Nury;Elisa Nury;Publisher: HAL CCSDCountry: Switzerland
International audience; This paper describes the workflow of the Grammateus project, from gathering data on Greek documentary papyri to the creation of a web application. The first stage is the selection of a corpus and the choice of metadata to record: papyrology specialists gather data from printed editions, existing online resources and digital facsimiles. In the next step, this data is transformed into the EpiDoc standard of XML TEI encoding, to facilitate its reuse by others, and processed for HTML display. We also reuse existing text transcriptions available on . Since these transcriptions may be regularly updated by the scholarly community, we aim to access them dynamically. Although the transcriptions follow the EpiDoc guidelines, the wide diversity of the papyri as well as small inconsistencies in encoding make data reuse challenging. Currently, our data is available on an institutional GitLab repository, and we will archive our final dataset according to the FAIR principles.
18 Research products, page 1 of 2
Loading
- Publication . 2019Open AccessAuthors:Angela Cossu;Angela Cossu;Country: France
International audience
- Publication . Part of book or chapter of book . 2019Open Access EnglishAuthors:Gelati, Francesco;Gelati, Francesco;Publisher: HAL CCSDProject: EC | EHRI (654164)
The European Holocaust Research Infrastructure (EHRI) portal website aims to aggregate digitally available archival descriptions concerning the Holocaust. This portal is actually a meta-catalogue, or an information aggregator, whose biggest goal is to have up-to-date information by means of building sustainable data pipelines between EHRI and its content providers. Just like in similar archival information aggregators (e.g. Archives Portal Europe or Monasterium), the XML-based metadata standard Encoded Archival Description (EAD) plays a key role. The article presents how EADs are imported into the portal, mainly thanks to the Open Archive Initiative protocols.
Average popularityAverage popularity In bottom 99%Average influencePopularity: Citation-based measure reflecting the current impact.Average influence In bottom 99%Influence: Citation-based measure reflecting the total impact.add Add to ORCIDPlease grant OpenAIRE to access and update your ORCID works.This Research product is the result of merged Research products in OpenAIRE.
You have already added works in your ORCID record related to the merged Research product. - Publication . 2018FrenchAuthors:Ginouvès, Véronique; Gras, Isabelle;Ginouvès, Véronique; Gras, Isabelle;Publisher: HAL CCSDCountry: France
International audience; En guise de postface, il nous a semblé nécessaire de revenir sur le processus collaboratif de la fabrication de cet ouvrage et de vous confier la genèse de ce projet. Tout est parti d'un constat pragmatique, de nos situations quotidiennes de travail : le/la chercheur·e qui produit ou utilise des données a besoin de réponses concrètes aux questions auxquelles il/elle est confronté·e sur son terrain comme lors de tous ses travaux de recherche. Produire, exploiter, diffuser, partager ou éditer des sources numériques fait aujourd'hui partie de notre travail ordinaire. La rupture apportée par le développement du web et l'arrivée du format numérique ont largement facilité la diffusion et le partage des ressources (documentaires, textuelles, photographiques, sonores ou audiovisuelles...) dans le monde de la recherche et, au-delà, auprès des citoyens de plus en plus curieux et intéressés par les documents produits par les scientifiques.
- Publication . Part of book or chapter of book . 2014Open Access GermanAuthors:Christof Schöch;Christof Schöch;
doi: 10.5281/zenodo.8510
Publisher: HAL CCSDCountry: FranceLicence Creative Commons Attribution 4.0 (CC-BY); The digital age, by making large amounts of text available to us, prompts us to develop new and additional reading strategies supported by the use of computers and enabling us to deal with such amounts of text. One such "distant reading" strategy is stylometry, a method of quantitative text analysis which relies on the frequencies of certain linguistic features such as words, letters or grammatical units to statistically assess the relative similarity of texts to each other and to classify texts on this basis. This method is applied here to French drama of the seventeenth century, more precisely to the now famous "Corneille / Molière- controversy". In this controversy, some researchers claim that Pierre Corneille wrote several of the plays traditionally attributed to Molière. The methodological challenge, it is shown here, lies in the fact that categories such as authorship, genre (comedy vs. tragedy) and literary form (prose vs. verse) all have an influence on stylometric distance measures and classification. Cross-genre and cross-form authorship attribution needs to distinguish such competing signals if it is to produce reliable attribution results. This contribution describes two attempts to accomplish this, parameter optimization and feature-range selection. The contribution concludes with some more general remarks about the use of quantitative methods in a hermeneutic discipline such as literary studies.
Average popularityAverage popularity In bottom 99%Average influencePopularity: Citation-based measure reflecting the current impact.Average influence In bottom 99%Influence: Citation-based measure reflecting the total impact.add Add to ORCIDPlease grant OpenAIRE to access and update your ORCID works.This Research product is the result of merged Research products in OpenAIRE.
You have already added works in your ORCID record related to the merged Research product. - Publication . 2018FrenchAuthors:Masclet De Barbarin, Marie;Masclet De Barbarin, Marie;Publisher: HAL CCSDCountry: France
International audience; Ce guide de bonnes pratiques éthiques et juridiques pour la diffusion des données en SHS est né de la réflexion d’un groupe de chercheurs, de professionnels de la documentation et de juristes structuré dans le cadre d’un groupe de travail Éthique et Droit. Face au renouvellement des problématiques liées aux droits d’auteurs, à la confidentialité, à la sécurisation et à la validation des données dans un contexte de mutation technologique, le groupe de travail Éthique et Droit a lancé un appel à communication ouvert à toutes les personnes s’intéressant aux problématiques éthiques et juridiques en matière de diffusion des données en SHS. Les auteurs ont été invités à proposer soit des retours d’expériences soit des articles portant sur les enjeux éthiques et juridiques en matière de diffusion des données en SHS, en explorant les solutions concrètes envisageables ou envisagées dans le cadre des cinq étapes de diffusion identifiées au préalable : la préparation de la recherche et l’anticipation de l’archivage ; la collecte des données ; le traitement, l’archivage et la description des données ; la diffusion des résultats de la recherche et la réutilisation des données.Il est important ici de souligner le caractère ambitieux de la démarche, à la fois prospective et réflexive, empirique et comparative, et surtout résolument pragmatique. Ce projet, labellisé par la Digital Research Infrastructure for the Arts and Humanities (DARIAH) en 2015 et financé par le Service commun de documentation (SCD) d’AMU, par la MMSH et par le consortium des ethnologues de la Très Grande Infrastructure de recherche (TGIR) Huma-Num a été supervisé par un comité scientifique qui s’est porté garant de la rigueur scientifique de la démarche.
- Publication . Part of book or chapter of book . 2017Open Access EnglishAuthors:Laurent Romary; Conny Kristel; Tobias Blanke;Laurent Romary; Conny Kristel; Tobias Blanke;Publisher: HAL CCSDCountry: France
International audience; Humanities have convincingly argued that they need transnational research opportunities and through the digital transformation of their disciplines also have the means to proceed with it on an up to now unknown scale. The digital transformation of research and its resources means that many of the artifacts, documents, materials, etc. that interest humanities research can now be combined in new and innovative ways. Due to the digital transformations, (big) data and information have become central to the study of culture and society. Humanities research infrastructures manage, organise and distribute this kind of information and many more data objects as they becomes relevant for social and cultural research.
Average popularityAverage popularity In bottom 99%Average influencePopularity: Citation-based measure reflecting the current impact.Average influence In bottom 99%Influence: Citation-based measure reflecting the total impact.add Add to ORCIDPlease grant OpenAIRE to access and update your ORCID works.This Research product is the result of merged Research products in OpenAIRE.
You have already added works in your ORCID record related to the merged Research product. - Publication . Other literature type . Part of book or chapter of book . 2020GermanAuthors:Baillot, Anne;Baillot, Anne;Publisher: HAL CCSDCountry: France
International audience; Erläutert wird zuerst, was unter dem Begriff "Digitalisierung" in Bezug auf Briefe zu verstehen ist. Im zweiten Teil wird der theoretische Unterbau vorgestellt. Der dritte Teil führt Fallbeispiele aus.
- Publication . Other literature type . Part of book or chapter of book . 2019Open Access FrenchAuthors:Bergounioux, Gabriel;Bergounioux, Gabriel;Publisher: HAL CCSDCountry: France
International audience; A la distinction traditionnelle entre transcription (traduction généralement alphabétique d'une donnée langagière orale) et annotation (enrichissement par un système de marques du texte obtenu par transcription), cet article substitue une prise en compte de la transcription comme première annotation, que ce soit dans les choix qui sont faits pour l'écriture des mots, leur séparation, l'usage de la ponctuation et des majuscules etc.
- Publication . 2016FrenchAuthors:Kunstmann, Pierre; Bozzi, Andrea; Parodi, Giovanni; Pierrel, Jean-Marie; Stein, Achim;Kunstmann, Pierre; Bozzi, Andrea; Parodi, Giovanni; Pierrel, Jean-Marie; Stein, Achim;Publisher: HAL CCSDCountry: France
International audience; Quand les organisateurs de notre congrès m’ont demandé, l’an dernier, d’animer la présente table ronde sur lesquestions « Quels corpus et quels outils d’exploitation de corpus », il s’agissait bien entendu dans leur esprit decorpus et d’outils électroniques. Non que les corpus statiques imprimés soient aujourd’hui sans valeur : ils sont encoreutilisés, quoique rarement. J’avoue d’ailleurs avoir commis moi-même un travail de ce genre. Petite anecdote : il y aplus d’une trentaine d’années, ma Concordance analytique de la Mort le Roi Artu, fut publiée aux Éditions del’Université d’Ottawa en 2 gros volumes, soit un total de pas moins de 2000 pages. Le regretté Kurt Baldinger, l’undes phares de la linguistique romane, dans un compte rendu qu’il fit paraître de mes deux volumes dans la revue denotre société, parla de heidenarbeit, travail de bénédictin. L’expression ne manqua pas de me surprendre, car j’avaisalors pris résolument le parti du numérique et je procédai avec une vitesse et une précision que notre confrère n’avaitsans doute pas pu imaginer. Nous assistions alors aux nouvelles Noces de Philologie et de Mercure, à l’ « allianceheureuse du génie informatique et de l'érudition textuelle »1. Les nouvelles technologies ont apporté au linguiste et auphilologue des aides considérables et des perspectives nouvelles, qui peuvent dérouter ou donner le vertige. Si elles nesauraient remplacer le jugement critique de l’expert, celui-ci, de son côté, ne saurait non plus se passer d’elles àchaque étape de sa recherche.
- Publication . Part of book or chapter of book . 2019Open Access EnglishAuthors:Elisa Nury;Elisa Nury;Publisher: HAL CCSDCountry: Switzerland
International audience; This paper describes the workflow of the Grammateus project, from gathering data on Greek documentary papyri to the creation of a web application. The first stage is the selection of a corpus and the choice of metadata to record: papyrology specialists gather data from printed editions, existing online resources and digital facsimiles. In the next step, this data is transformed into the EpiDoc standard of XML TEI encoding, to facilitate its reuse by others, and processed for HTML display. We also reuse existing text transcriptions available on . Since these transcriptions may be regularly updated by the scholarly community, we aim to access them dynamically. Although the transcriptions follow the EpiDoc guidelines, the wide diversity of the papyri as well as small inconsistencies in encoding make data reuse challenging. Currently, our data is available on an institutional GitLab repository, and we will archive our final dataset according to the FAIR principles.