You have already added 0 works in your ORCID record related to the merged Research product.
You have already added 0 works in your ORCID record related to the merged Research product.
<script type="text/javascript">
<!--
document.write('<div id="oa_widget"></div>');
document.write('<script type="text/javascript" src="https://www.openaire.eu/index.php?option=com_openaire&view=widget&format=raw&projectId=undefined&type=result"></script>');
-->
</script>
Aspects textuels de la procédure judiciaire exploitée en analyse criminelle et perspectives pour son traitement automatique
Aspects textuels de la procédure judiciaire exploitée en analyse criminelle et perspectives pour son traitement automatique
L'analyse criminelle est une discipline d'appui aux enquêtes pratiquée au sein de la Gendarmerie Nationale. Elle repose sur l'exploitation des documents compilés dans le dossier de procédure judiciaire (auditions, perquisitions, rapports d'expertise, données téléphoniques et bancaires, etc.) afin de synthétiser les informations collectées et de proposer un regard neuf sur les faits examinés. Si l'analyse criminelle a recours à des logiciels de visualisation de données (i. e. Analyst's Notebook d'IBM) pour la mise en forme des hypothèses formulées, la gestion informatique et textuelle des documents de la procédure est entièrement manuelle. Or, l'analyse criminelle s'appuie entre autres sur le concept d'entités pour formaliser son travail. La présentation du contexte de recherche détaille la pratique de l'analyse criminelle ainsi que la constitution du dossier de procédure judiciaire en tant que corpus textuel. Nous proposons ensuite des perspectives pour l'adaptation des méthodes de traitement automatique de la langue (TAL) et d'extraction d'information au cas d'étude, notamment la mise en parallèle des concepts d'entité en analyse criminelle et d'entité nommée en TAL. Cette comparaison est réalisée sur les plans conceptuels et linguistiques. Une première approche de détection des entités dans les auditions de témoins est présentée. Enfin, le genre textuel étant un paramètre à prendre en compte lors de l'application de traitements automatiques à du texte, nous construisons une structuration du genre textuel « légal » en discours, genres et sous-genres par le biais d'une étude textométrique visant à caractériser différents types de textes (dont les auditions de témoins) produits par le domaine de la justice.
Criminal analysis is a discipline that supports investigations practiced within the National Gendarmerie. It is based on the use of the documents compiled in the judicial procedure file (witness interviews, search warrants, expert reports, phone and bank data, etc.) to synthesize the information collected and to propose a new understanding of the facts examined. While criminal analysis uses data visualization software (i. e. IBM Analyst's Notebook) to display the hypotheses formulated, the digital and textual management of the file documents is entirely manual. However, criminal analysis relies on entities to formalize its practice. The presentation of the research context details the practice of criminal analysis as well as the constitution of judicial procedure files as textual corpora. We then propose perspectives for the adaptation of natural language processing (NLP) and information extraction methods to the case study, including a comparison of the concepts of entity in criminal analysis and named entity in NLP. This comparison is done on the conceptual and linguistic plans. A first approach to the detection of entities in witness interviews is presented. Finally, since textual genre is a parameter to be taken into account when applying automatic processing to text, we develop a structure of the 'legal' textual genre into discourse, genres, and sub-genres through a textometric study aimed at characterizing different types of texts (including witness interviews) produced by the field of justice.
- CY Cergy Paris University France
- Université Paris Diderot France
Corpus linguistics, Information extraction, Natural language processing, [INFO.INFO-TT] Computer Science [cs]/Document and Text Processing, Criminal analysis, Analyse criminelle, [SHS.LANGUE] Humanities and Social Sciences/Linguistics, Extraction d'information, Genre textuel, Textual genre, [INFO.INFO-TT]Computer Science [cs]/Document and Text Processing, Traitement automatique des Langues, [INFO.INFO-IR]Computer Science [cs]/Information Retrieval [cs.IR], Linguistique de corpus, [INFO.INFO-IR] Computer Science [cs]/Information Retrieval [cs.IR], [SHS.LANGUE]Humanities and Social Sciences/Linguistics
Corpus linguistics, Information extraction, Natural language processing, [INFO.INFO-TT] Computer Science [cs]/Document and Text Processing, Criminal analysis, Analyse criminelle, [SHS.LANGUE] Humanities and Social Sciences/Linguistics, Extraction d'information, Genre textuel, Textual genre, [INFO.INFO-TT]Computer Science [cs]/Document and Text Processing, Traitement automatique des Langues, [INFO.INFO-IR]Computer Science [cs]/Information Retrieval [cs.IR], Linguistique de corpus, [INFO.INFO-IR] Computer Science [cs]/Information Retrieval [cs.IR], [SHS.LANGUE]Humanities and Social Sciences/Linguistics
142 references, page 1 of 15
6.3 Sur l'organisation documentaire . . . . . . . . . . . . . . . . . . 21
6.4 Sur le texte et le contenu . . . . . . . . . . . . . . . . . . . . . . . 22
7 Conclusion : que proposer à l'analyse criminelle? . . . . . . . . . . . . 23
II De la procédure judiciaire criminelle au corpus textuel 25 1 Qu'est-ce qu'une procédure judiciaire? . . . . . . . . . . . . . . . . . . 26 2 Les pièces de procédure . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.1 Documents réglementaires et de procédure . . . . . . . . . . . . 28
2.2 Documents d'information . . . . . . . . . . . . . . . . . . . . . . 29
2.3 Synthèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 3 Le texte de la procédure judiciaire . . . . . . . . . . . . . . . . . . . . . 45
3.1 Le concept de corpus selon la linguistique de corpus . . . . . . 45
3.2 Corpus réflexifs, corpus hétérogènes . . . . . . . . . . . . . . . . 47
3.3 Et la procédure? . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
citations This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).0 popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.Average influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).Average impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.Average citations This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).0 popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.Average influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).Average impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.Average Powered byBIP!