Titre du projet :
Porteur·e :
Martinot-Lagarde Tifenn |
Courrier électronique :
tifenn.martinot-lagarde@bnf.fr |
Adresse :
Quai François Mauriac 75706 Paris cedex 13 |
Téléphone :
0624394878 |
Statut :
Conservateur |
|
Institution du porteur·se du projet :
Bibliothèque nationale de France (BNF) |
|
CV du porteur·se de projet :
|
|
Biographie du porteur·se de projet :
|
Institution partenaire | Laboratoire | Lettre d’engagement |
---|---|---|
Université Paris 8 (UP8) | EA 2302 Esthétique – UP8 | Lettre-dengagement-ESTCA.pdf |
Archives nationales | Lettre-engagement-AN.pdf |
NOM et Prénom | Institution – Statut |
---|---|
MARTINOT-LAGARDE Tifenn | Bibliothèque ntaionale de France Statut : Conservateur |
MOREUX Jean-Philippe | Bibliothèque nationale de France Statut : chef de mission IA (DSR) |
SORIN Cécile | ESTCA UP8 Statut : PR |
TURQUETY Benoît | ESTCA UP8 Statut : PR |
DESIRE Lou-Andréa | ESTCA UP8 Statut : Doctorant |
PAPPA Anna | LIASD UP8 Statut : MCF |
KYRIAKOGLOU Revekka | LIASD UP8 Statut : MCF |
MILLOUR Alice | LIASD UP8 Statut : MCF |
ROULLIER Clothilde | Archives nationales Statut : Chargée de mission auprès du directeur |
ROTOLO Emeline | Archives nationales Statut : responsable des fonds cinéma |
SIN-BLIMA BARRU Martine | Archives nationales Statut : Conservateur |
LE GENDRE Romain | Archives nationales Statut : Conservateur |
CHAZALON Joseph | EPITA – LRE Statut : Chercheur |
CARLINET Edwin | EPITA – LRE Statut : Chercheur |
de PASTRE Béatrice | CNC Statut : Directrice des collections |
MOUSTACCHI Dominique | CNC Statut : Chargée de projets éditoriaux |
DAIRE Joël | Cinémathèque française Statut : Directeur du patrimoine |
VIGNOT Martine | Cinémathèque française Statut : Directrice des collections non films |
ROSSIGNOL Véronique | Cinémathèque française Statut : Directrice de la bibliothèque |
- Technologies et médiations humaines
- Quelle est la durée du projet : 2 ANS
Ce programme de recherche en 2 ans a pour objectif de contribuer à donner une nouvelle visibilité aux femmes dans les métiers du cinéma français à travers son histoire en permettant de les compter et de les nommer. Il propose de traiter par IA (LIASD et laboratoire de recherche de l’EPITA) les annuaires professionnels du cinéma et la presse spécialisée (BnF, Cinémathèque française) pour en extraire les noms de femmes et les compter par catégories de métiers, en croisant ces sources avec les cartes professionnelles et dossiers de scolarité de l’IDHEC notamment (AN, CNC).
Les résultats de cette fouille par l’IA seront ensuite exploités par des chercheurs de plusieurs universités dont Paris 8 (ESTCA) pour interroger les catalogues et collections de ces institutions. Les résultats seront présentés lors d’un colloque, à travers une exposition ainsi que par des articles scientifiques et une diffusion en ligne.
Ce projet Artec a également pour objectif de préparer un futur dépôt ANR.
En France, la mise en valeur des femmes dans l’histoire du cinéma est longtemps restée cantonnée au militantisme féministe de l’après Mai 68, à l’écart des travaux d’historiens. De rares publications se sont concentrées sur les films dits «de femmes» (publications de Paule Lejeune, Jackie Buet, Françoise Audé) ou sur les réalisatrices (travaux de Brigitte Rollet, sur Coline Serreau et Jacqueline Audry, de Charles Ford puis Tami Williams sur Germaine Dulac) et sur un nombre très limité de personnalités. La mise en lumière récente de pionnières du cinéma muet, telles Alice Guy[1], Musidora[2], et dans une moindre mesure Germaine Dulac[3], a renforcé le sentiment d’une invisibilisation des femmes dans l’histoire du cinéma, invisibilisation encore plus forte quand il s’agit des métiers de l’ombre. Malgré le développement récent d’études sur les métiers techniques du cinéma, celles-ci se concentrent rarement sur les questions de genre, d’autant moins quand elles portent sur des métiers presque exclusivement masculins[4].
Le programme de recherche a pour objectif de sortir les professionnelles de l’histoire du cinéma de leur invisibilité en permettant de les compter et de les nommer.
Pour la période récente, grâce aux études régulières publiées par le CNC en partenariat avec le groupe Audiens depuis 2014, nous disposons de chiffres sur la part des femmes dans l’emploi de la production cinématographique qui remontent à 2006-2009. Mais ces chiffres ne sont pas rassemblés pour la longue période qui précède le début des années 2000 malgré les études complémentaires d’associations[5]. Pour ce faire, il faut aller chercher des informations éparses dans les annuaires professionnels, qui couvrent presque toutes les années de 1917 à nos jours, et dont le volume rend difficile un dépouillement manuel. Un mémoire de master s’y est essayé en 2009, par sondage sur cinq années entre 1952 et 1967, avec des résultats très intéressants[6].
Il est donc proposé d’utiliser les outils de l’Intelligence artificielle pour fouiller une partie de ces annuaires, conservés à la Bibliothèque nationale de France (BnF), afin d’en extraire les noms de femmes et de les compter par catégories de métiers. Ces sources seront complétées par la presse spécialisée en cinéma, conservée à la BnF et à la Cinémathèque française, ainsi que par les cartes professionnelles du CNC et les dossiers de l’IDHEC/La Fémis, conservés aux Archives nationales et autres sources du centre de ressources du CNC.
Les résultats de cette fouille par l’IA seront ensuite exploités pour interroger par noms les catalogues et collections des institutions susmentionnées, afin d’étudier la place et le rôle de ces femmes dans les différents métiers du cinéma français à travers son histoire. Les résultats du programme seront présentés lors d’un colloque et par l’organisation d’une exposition avec possibilité de projection en lien avec le CNC.
Ce projet Artec a également pour objectif de constituer une équipe, des partenariats institutionnels et une prise en main de la fouille par IA en vue du dépôt d’un futur projet ANR.
Le projet s’inscrit dans l’axe « les technologies et les médiations humaines » d’ArTeC, et dans ses champs de recherche : “Art et genre”, “La médiation par la robotique et l’intelligence artificielle”, “Expositions et performances comme outils et dispositifs de médiation”.
[1] Récentes publications qui complètent les travaux plus anciens de Victor Bachy ou de Francis Lacassin.
[2] Carole Aurouet, Marie-Claude Cherqui et Laurent Véray (dir.), Musidora qui êtes-vous ?, 2022.
[3] Germaine Dulac, Qu’est-ce que le cinéma, textes réunis par Marie-Anne Colson-Malleville, édité par Clément Lafite et Tami Williams, 2020.
[4] Laurent Le Forestier et Priska Morrissey (dir.), Pour une histoire des métiers du cinéma, des origines à 1945, 2011 ; Hélène Fleckinger, Kira Kitsopanidou, Sébastien Layerle (dir.), Métiers et techniques du cinéma et de l’audiovisuel. Sources, terrains, méthode, 2020 ; Katalin Pór et Caroline Renouard (dir.) avec la collaboration de Mélisande Leventopoulos, L’Équipe de film au travail – Créations artistiques et cadres industriels, 2023 ; Morgan Lefeuvre, Les manufactures de nos rêves, les studios de cinéma français des années 1930, 2021 ; Priska Morrissey, Les As de la manivelle, le métier d’opérateur de prise de vue cinématographique en France 1895-1930, 2022.
[5] Guilde des scénaristes, La Place des femmes parmi les auteurs écrivant du cinéma français sur dix ans, 2003-2012 ; Collectif 50/50 sur les femmes dans la compétition du festival de Cannes depuis 1946, sur leur part parmi les nommées et récompensées de l’Académie des Césars depuis 1976, et parmi les critiques de films en Europe 2018-2019.
[6] Sophie Hofstetter, Techniciennes et professionnelles du cinéma pendant la Nouvelle Vague : quels statuts et quelles fonctions pour les femmes de l’ombre ?, mémoire de Master 2 sous la direction de Frédéric Gimello-Mesplomb, Université Paul Verlaine de Metz, 2009.
Année 1
Un corpus de 10 à 33 annuaires sera choisi parmi trois séries conservées à la BnF sur une période à définir entre les années 1920 et 2000. La BnF se charge de numériser sur ses crédits les annuaires non encore numérisés. Voir la liste des annuaires parmi lesquels le corpus sera constitué.
La fouille de données sur les annuaires sera assurée par le laboratoire de recherche (LRE) de l’école d’ingénieurs en intelligence informatique l’EPITA, qui apportera l’expertise et l’outillage acquis sur des annuaires en source primaire pour le projet ANR SODUCO (https://anr.fr/Projet-ANR-18-CE38-0013). Elle impliquera la détection de la mise en page, l’océrisation et l’extraction d’information en vue de produire des données structurées pour les phases suivantes du projet.
L’analyse de mise en page et l’OCR produiront un flux de texte structuré à partir des images des annuaires, en adaptant la chaîne technique du projet SODUCO. Deux livraisons de données sont prévues, afin de travailler en mode itératif avec les partenaires.
Pour le volet d’extraction, la boîte à outils du projet SODUCO sera aussi mise à contribution, avec réentraînement de certains modèles de reconnaissance d’entités : noms, professions, organisations, lieux, etc.
L’activité technique sera encadrée par deux enseignants-chercheurs du LRE, portée par eux et par des ingénieurs juniors.
Le LRE fournira une prestation technique spécifique au projet incluant des frais de personnels non permanents, de matériel et d’infrastructure de calcul.
Le corpus de presse sera constitué de titres spécialisés en cinéma, numérisés ou en cours de numérisation, du Conservatoire national de la presse de la BnF, pouvant être complétés par des titres de la Cinémathèque française. Voir la liste des titres parmi lesquels le corpus sera constitué.
Le LIASD se concentrera sur l’analyse de l’évolution des métiers du cinéma occupés par les femmes, à partir des mentions présentes dans la presse sur des périodes définies. L’approche consistera à segmenter le corpus par périodes et à extraire automatiquement les termes liés aux métiers des femmes. Des analyses statistiques permettront de suivre la fréquence et l’apparition de ces termes dans le temps. En parallèle, une étude contextuelle et qualitative sera menée pour détecter les évolutions sémantiques et l’apparition de nouveaux métiers. Les résultats seront présentés sous forme de visualisations, incluant des graphiques temporels et des cartes de co-occurrence, pour mettre en lumière les tendances et changements dans la manière dont la presse traite ces métiers en relation avec les femmes. Deux stagiaires de 6 mois seront recrutés.
Sur les deux volets (annuaires, presse) des vérifications et croisements de sources avec les Archives nationales (cartes professionnelles, dossiers de scolarité de l’IDHEC 1944-1988), la Cinémathèque française (fonds d’archives, revues) et le CNC viendront consolider les résultats des fouilles, par dépouillement manuel.
Une correction humaine des données produites automatiquement sera effectuée par échantillon, en associant les partenaires du projet, institutions patrimoniales et enseignants-chercheurs, ainsi que le master « Technologies numériques appliquées à l’histoire » de l’Ecole nationale des chartes (à contacter).
Année 2
Des chercheurs spécialisés en études cinématographiques exploiteront les données inédites issues des fouilles, venant consolider (thèse de L-A Désiré sur la direction de casting), enrichir des travaux en cours (recherches sur l’histoire des techniques et métiers du son – B Turquety), initier de nouveaux travaux (encadrement de mémoires de master sur les femmes critiques de films – C Sorin).
Au-delà de Paris 8, plusieurs universités seront sollicitées (Paris Nanterre, Paris 1, Paris 3, Paris-Cité, Versailles Saint-Quentin/Paris Saclay , Rennes 2) en répartissant les métiers à étudier.
Les données extraites en année 1 apporteront des clés nouvelles de recherche dans les catalogues et archives des institutions partenaires.
Outre des statistiques quantitatives sur la part des femmes dans chacun des métiers, des études sur les contextes de leur exercice et portraits de professionnelles pourront être réalisés. Les degrés de féminisation des métiers détermineront des approches différenciées, tournées sur le groupe ou sur quelques personnalités selon que les métiers sont majoritairement féminins (scripte, couturière, habilleuse) ou masculins (scénario, réalisation, musique, image, son, décor).
Le colloque pourra stimuler les analyses des données extraites, valoriser les résultats de l’exploitation avec projection en lien avec le CNC et constituer une base de travail venant structurer un futur dépôt ANR.
L’exposition permettra de donner une nouvelle visibilité aux professionnelles du cinéma. Elle présentera des reproductions de fonds photographiques d’archives, de manuscrits, de correspondances, de périodiques mettant en scène des femmes en action, et retracer des parcours de professionnelles.
Les recherches menées dans le cadre de ce projet produiront des articles scientifiques qui pourront être présentés dans des conférences internationales traitant des problématiques rencontrées.
Ces articles seront mis à disposition sur la plateforme HAL ou sur la plateforme Hypothèses.org d’OpenEdition.
Ils pourront également être publiés dans le carnet de recherche de la BnF, ainsi que dans Chroniques, revue de la BnF, y compris pour rendre compte du colloque et de l’exposition.
Les résultats des analyses statistiques menées sur la base de données seront publiées sur le répertoire de travaux de recherche Zenodo et sur le système d’archives ouvertes HAL.
Les traitements informatiques se dérouleront au BnF Datalab pour les parties du corpus sous droit, dans les locaux de l’EPITA, du LIASD ou du Datalab pour celles relevant du domaine public.
Le LRE de EPITA traitera 15 000 à 50 000 pages (soit 10 à 33 annuaires de 1500 pages en moyenne) par le pipeline technique, issues de documents numérisés dans Gallica, pour partie en accès libre (domaine public).
Le LIASD procédera à la collecte des articles de presse numérisés du corpus disponibles sur Gallica en utilisant des techniques de scraping. Ce corpus d’articles de presse en lien avec les métiers des femmes au cinéma sera utilisé pour des analyses approfondies.
Les données brutes produites par la phase d’extraction du LRE et de LIASD seront librement diffusées et partagées (api.bnf.fr, Zenodo). Les données personnelles seront traitées selon le cadre juridique en vigueur (RGPD).
Une ou deux bases de données internes au projet, hébergées par la BnF, seront constituées en agrégeant les données personnelles des professionnelles du cinéma et leurs mentions dans les sources documentaires convoquées par le projet d’une part et les mentions trouvées dans la presse d’autre part.
Les données personnelles seront traitées selon le cadre juridique en vigueur (RGPD).
Des analyses quantitatives et qualitatives seront réalisées, en particulier autour des critiques de presse (positives ou négatives) et leur lien avec les métiers des femmes dans le cinéma.
Les résultats des analyses statistiques sur les professionnelles du cinéma et des analyses issues de la presse seront publiés sur des plateformes de recherche ouverte telles que Zenodo et HAL.
La consultation des cartes professionnelles du CNC et des dossiers de scolarité de l’IDHEC fera l’objet de demandes de dérogation pour les documents de moins de 50 ans et comportant des certificats médicaux.
La diffusion des résultats se fera selon le cadre juridique en vigueur (propriété intellectuelle et RGPD).
Un colloque sera organisé à la fin de l’année 2 dans les locaux d’une des institutions partenaires (BnF site Richelieu, INHA par convention avec l’université de Paris 8 et/ou Archives nationales). Les différents collaborateurs pourront intervenir afin de présenter le projet dans ses différentes phases : méthodologie de la constitution des corpus et de la fouille de données, exploitation et résultats. Le colloque constituera également un temps de rencontre convivial et de partage entre des professionnels d’institutions patrimoniales, des ingénieurs informatiques intéressés par la fouille de données, des enseignants chercheurs et étudiants en études cinématographiques ainsi que des professionnels du cinéma.
Une exposition sous la forme de reproductions, permettra de donner une nouvelle visibilité à la place des femmes dans les métiers du cinéma. Elle pourra valoriser des fonds photographiques (photographies de plateau issues des collections de la Cinémathèque française ou photos de presse du département des Estampes et de la Photographie de la BnF), des reproductions d’archives, de manuscrits et de correspondances, des périodiques mettant en scène des femmes en action, de retracer des parcours de professionnelles. L’exposition pourrait se tenir sur le campus de l’Université Paris 8 ou de façon itinérante chez différents partenaires du projet.
Les résultats des recherches pourront également venir enrichir les catalogues et inventaires des institutions patrimoniales partenaires (BnF, Archives nationales, Cinémathèque française), en particulier les notices d’autorité du catalogue de la BnF.
La mise en ligne des annuaires numérisés sur Gallica et Gallica intramuros pourra être accompagnée de billets de blogs.
Les résultats des dépouillements réalisés sur les fonds des Archives nationales pourront également faire l’objet de billets sur le blog Hypothèse de l’institution, avec des renvois vers les billets de la Bibliothèque nationale.
Des articles dans des revues spécialisées ainsi que dans Chroniques, revue de la BnF, pourront rendre compte du colloque et de l’exposition.
Le projet dans toutes ses dimensions (corpus, fouille de données, exploitation, colloque, exposition) pourra venir structurer et alimenter un futur dépôt ANR.
lettre-dengagement-LIASD-Paris-8.pdf
Lettre-dengagement-LRE-EPITA.pdf
Liste-des-Annuaires-du-cinema-BnF-pour-selection-de-corpus.pdf
Annexe-Exemple-dannuaire-Le-Tout-Cinema-1938.pdf
Liste-des-titres-cinema-du-Conservatoire-national-de-la-presse-BnF-pour-selection-de-corpus.pdf