project:image_extraction_ant_processing

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
project:image_extraction_ant_processing [2017/05/13 00:13] – [Description et objectifs du projet] risuciuproject:image_extraction_ant_processing [2017/05/18 17:48] (current) – [Description et objectifs du projet] risuciu
Line 1: Line 1:
-===== Image Extraction and Processing ===== +===== Extraction automatique d'illustrations à partir de livres anciens =====  
- +{{ :project:de_bry0.jpeg?800 |}}
-{{ :project:debry1.jpeg?|600}} +
  
  
 ===== Description et objectifs du projet ===== ===== Description et objectifs du projet =====
  
-{{ :project:debry2.png?300|}} Le Bodmer Lab de l'Université de Genève vient d'achever la numérisation d'une importante collection de livres de voyage de la Renaissance, publiés aux XVIe-XVIIe siècles et richement illustrés par des gravures et de cartes. A cet ensemble s'ajoutent plus de 200 éditions du Faust de Goethe, souvent illustrées. Ces deux sets de données ont été mis à disposition des participants de Geneva Open Libraries (#GEOPENGLAM).+ Le Bodmer Lab de l'Université de Genève vient d'achever la numérisation d'une importante collection de livres de voyage de la Renaissance, publiés aux XVIe-XVIIe siècles et richement illustrés par des gravures et de cartes. A cet ensemble s'ajoutent plus de 200 éditions du //Faust// de Goethe, souvent illustrées. Ces deux sets de données sont mis à disposition des participants de Geneva Open Libraries (#GEOPENGLAM) pendant le #OGH17, et en anticipant leur publication sur le site du Bodmer Lab, attendue au printemps 2018.
  
 Ce projet #GEOPENGLAM se propose d'identifier et d'extraire automatiquement les illustrations des ces quelque 50'000 pages. Un processus d'indexation et de "tagging" est par la suite envisagé. Au-delà de ce processus d'analyse quantitative des données, notre ambition est de créer une interface pouvant répertorier les illustrations et permettre aux chercheurs, par la suite de faire des classements et des analyses qualitatives (quelles gravures sont répétées dans plusieurs volumes, quelles similitudes peut-on déceler à travers la collection, etc).  Ce projet #GEOPENGLAM se propose d'identifier et d'extraire automatiquement les illustrations des ces quelque 50'000 pages. Un processus d'indexation et de "tagging" est par la suite envisagé. Au-delà de ce processus d'analyse quantitative des données, notre ambition est de créer une interface pouvant répertorier les illustrations et permettre aux chercheurs, par la suite de faire des classements et des analyses qualitatives (quelles gravures sont répétées dans plusieurs volumes, quelles similitudes peut-on déceler à travers la collection, etc). 
  
-===== Data ===== +===== Prototype ===== 
- +Le prototype est disponible sur GitHub[[https://github.com/EtiennePasteur/Lettrine]]
-https://github.com/VonUniGE/bodmernav+
  
 +===== Documentation =====
 +Documentation disponible ici [[https://etiennepasteur.github.io//Lettrine/docs/fonctionnement/]]
 ===== Team ===== ===== Team =====
  
-Université de Genève     ^ CERN       EPITECH Lyon          + 
-| Pierre-Yves Burgi <pierre-yves.burgi@unige.ch>   | Blandine Blukacz-Louisfert <bblukacz-louisfert@unog.ch>     Adam Krim <adam.krim@epitech.eu>                                                               Anouk Dunant Gonzenbach <anouk.dunant-gonzenbach@etat.ge.ch> +^BodmerLab (UNIGE)      ^ EPITECH Lyon  ^ CERN    ^CUI (UNIGE)^  
-                           | Colin Wells <cwells@unog.ch> | Louis Schneider <louis.schneider@epitech.eu|       +| Pierre-Yves Burgi <pierre-yves.burgi@unige.ch>  Etienne Pasteur <etienne.pasteur@epitech.eu>Carmen  CadenasSaba Kvesitadze |                                                         
-                           | Maria Jose Lloret <mjlloret@unog.ch> Adrien Bayles <adrien.bayles@epitech.eu>         +Radu Suciu <radu.suciu@unige.ch>    Alexandre <alexandre@szymocha.com> |  
-|                                                                                           | Paul Varé <paul.vare@epitech.eu> |            |+ Dimitri Mas <dimitri.mas@epitech.eu>               
 + 
 +                                                      
    
 +
 +
 {{:project:geneva_open_libraries_logo.png?nolink&120|}}  {{:project:geneva_open_libraries_logo.png?nolink&120|}} 
  
Line 28: Line 31:
 {{tag>status:concept glam}} {{tag>status:concept glam}}
  
 +
 +===== Déroulement du projet =====
 +
 +**Vendredi après-midi:**
 +Après la sélection du set de données (un ensemble d'ouvrages de voyage de la Renaissance, le "cluster" De Bry du Bodmer Lab http://bodmerlab.unige.ch/recherche/theodore-de-bry/), une première séance de travail a été consacrée à la conception de l'algorithme d'extraction des illustrations. A minuit une première version fonctionnelle était déjà disponible.
 +
 +
 +**Samedi:**
 +Le système est encore affiné, afin qu'il puisse reconnaître davantage d'illustrations, notamment les lettrines. L'interface de présentation de la démo est achevée pendant la soirée. Production d'un poster de présentation des objectifs du projet et des résultats. 
 +
 +**Dimanche:**
 +Présentation du prototype lors de la séance de plénière au Campus Biotech.
 +
 +
 +{{:project:img_20170513_143744.jpg?200 }}{{:user:img_20170513_111416.jpg?200 }}{{:project:img_20170513_135810.jpg?200}}
 +
 +
 +
 +===== Poster =====
 +[[http://bodmerlab.unige.ch/admin/wp-content/uploads/2017/05/poster-final-OGH-GEOPENGLAM.pdf|Cliquez ici pour télécharger la version pdf du poster]]. Version web ci-dessous.
 +
 +{{ :project:poster_final_ogh_geopenglam.jpg?800 |}}
  • project/image_extraction_ant_processing.1494627226.txt.gz
  • Last modified: 2017/05/13 00:13
  • by risuciu