ZOO

Geo Comix, quand la technologie se met au service de l'édition

Durant les Assises du Livre Numérique de décembre 2021, un nouveau logiciel de traduction a été présenté au public : Geo Comix. Celui-ci s’appuie sur une IA capable de détecter les différents éléments d’une planche de BD, notamment le texte et les bulles. Zoo a rencontré les deux fondateurs de ce nouvel outil qui va révolutionner le travail de traducteur, de lettreur et peut-être même d’éditeur !


Qu’est-ce que Geo Comix ?


Denis Lefebvre : Geo Comix est une IA pour les traducteurs, les correcteurs, les lettreurs et les éditeurs. Ce n’est pas une IA de traduction automatique, elle ne vient pas remplacer des métiers mais les aider. C’est un outil qui vient faire gagner du temps. Le métier de la traduction n’a pas évolué depuis 25 ans, les traducteurs s’envoient encore des fichiers Excel. C’est archaïque tout ça ! On vient apporter quelque de nouveau et d’utile.

Samuel Petit : C’est un outil de TAO : de traduction assistée par ordinateur. L’IA détecte et comprend la structure des planches de BD. C’est quelque chose de terriblement complexe : parce qu’à part Tintin qui a des cases bien carrées, des bulles bien blanches et du texte bien défini, dès qu’on part avec du Joann Sfar, du manga, des cases en ellipse, …


Analyse d’image par l’IA Geo sur Charlotte Impératrice

Analyse d’image par l’IA Geo sur Charlotte Impératrice © Dargaud
© Geo Comix 2022


L’IA doit faciliter le travail de traduction. Par exemple, quand le lettreur réimporte la traduction du traducteur, il doit faire des milliers de copier-coller fastidieux et longs. Alors qu’avec l’IA cela prend trois secondes : ce qui lui permet de se focaliser davantage sur le design de son lettrage.

Denis Lefebvre : Il peut passer plus de temps sur son cœur de métier, sur sa valeur ajoutée. C’est pareil pour la traduction. Ou la coordination éditoriale. Les éditeurs passent beaucoup de temps à échanger par mail : avec Geo Comix, les échanges sont centralisés et synchronisés. L’évolution du travail est aussi conservée, stockée sur un cloud, en cas d'erreur.


Comment en êtes-vous arrivés à créer cet outil ? Êtes-vous issus du monde de la traduction ?


S.P : On ne vient pas du monde de la traduction mais plutôt de celui de l’édition. On n’arrive pas avec le regard naïf de ceux qui viennent seulement de la technologie. J’ai fondé une petite maison d’édition Tanibis, qui a été lauréate à Angoulême. Je ne m’en occupe plus depuis longtemps : maintenant c’est Claude Amauger l’âme de cette maison. Après j’ai eu diverse expérience, j’ai rencontré Denis à Libella (Les Cahiers Dessinés).

D.L : Je suis passé par plusieurs maisons d’édition aux textes noirs, par les éditions stock. Au sein du groupe Libella, j’étais dans la partie plus communication et marketing. Depuis 2010, Actialuna cherchait à mettre la technologie aux services des éditeurs. Ce qui n’est pas forcément évident. On a essayé de faire ça avec Samuel en tant qu’éditeur et libraire numérique, et on a cofondé du coup Geo Comix.

S.P : Géo Comix c’est le nouveau nom de Actialuna. Depuis 10 ans, on faisait de l’édition numérique (par exemple L’homme volcan), puis on a créé une librairie numérique de BD qui s’appelait Sequencity, en partenariat avec Leclerc avant qu’ils ne décident de continuer seuls. L’entreprise a toujours eu une dimension très technologique : pendant 7 ans, on a développé une IA qui devait booster Sequencity. Au moment de la séparation avec Leclerc, l’IA a continué son chemin de son côté.

Cette IA est arrivée à maturité il y a 1 ans, il a fallu beaucoup de temps pour la créer. Geo Comix est notre projet secret qui émerge après un temps très long de recherche et développement.


Analyse d’une planche de La Rose de Versailles © Shueisha

Analyse d’un strip de La Rose de Versailles © Shueisha
© Geo Comix 2022


On a été lauréat de différents programmes (deux fois des Investissements de l’Avenir) et on a collaboré avec l’Université de La Rochelle. En 2010, quand on crée notre entreprise, l’IPad n’est pas sorti. Tout est à faire ! Alors, deux thèses attirent mon attention : deux doctorants de l'Université de La Rochelle on fait un premier jeu de données de détection de cases et de textes. Quand on les a rencontrés, on a vite compris que ça ne marchait que sur quelques BD. En 2017, l’Agence Nationale de la Recherche (ANR) s’est intéressée à nous parce qu’on commençait à avoir des résultats plus conséquents. Elle a demandé à ce qu’on formalise notre partenariat avec l’Université de La Rochelle dans un laboratoire commun avec l’ANR. Deux enseignants chercheurs ont travaillé à plein temps avec l’équipe de développeurs, Denis et moi.

Plus tard, on a collaboré avec Media participation, sur un petit catalogue à l’export porté par Europe Comics. Le logiciel est devenu de plus en plus sérieux et c’est imposé par rapport à nos autres activités.


A quel genre de limites se heurte l’IA ?


S.P : L’IA a du mal à détecter le texte flottant. Mais, quand il n’y a pas de bulles, l’algorithme passe à de la détection de texte automatiquement et s’abstrait de la notion de bulle. Quand l’IA est confrontée à un nouveau défi, on fait des corrections.

D.L : C’est essentiel avec une IA : ça entraine les algorithmes et les améliore.

S.P : Récemment on a été confrontés à pas mal de comics avec des textes flottants qui n’étaient pas détectés car ils étaient stylisés, un peu graphiques. Comme par exemple "Superman par Jérôme Siegel". L’IA les traduisait par des chiffres ou des points. Ou parfois les ignorait simplement.


Case extraite de “Action Comics” #7

Case extraite de “Action Comics” #7
© DC Comics, éditions 2022


Sur le dernier mois, on est passés d’un charabia à presque la transcription correcte sauf quand il y a des effets de relief ponctuels au milieu de texte.

On a déjà aussi eu le cas où, dans une bulle de contexte jaune, il y avait un petit logo Batman. L’algorithme ne comprenait rien : alors on l’a entrainé à rester concentré sur le texte et à ignorer ce genre de logo. Le mois suivant, les bulles de ce genre étaient parfaitement maitrisées. On en aura tout le temps des cas comme ça : parce que la diversité de la BD est folle. On absorbe petit à petit les cas extrêmes.

On a un autre défi lié aux onomatopées : pour les extraire, les comprendre alors que ce sont des éléments très graphiques. Et puis en japonais, les onomatopées ont une diversité beaucoup plus grande que les nôtres. Il existe des dictionnaires d’onomatopées au Japon. Elles ont des formes encore plus variées dans le manga que dans la BD franco-belge. Ce ne sont pas toujours des sons - boum, bam – il y a des onomatopées pour dire que l’on est déprimé. On n’est pas dans le même registre linguistique, sémantique.


Y a-t-il une limite de capacité : un nombre d’utilisateurs, de pages limitées ?


D.L : Il n’y a pas de limite de pages, ni de limite de personnes impliquées.


Avez-vous d’autres projets à partir de cet outil ?


S.P : Cette compréhension de la page permise par l’IA va permettre de développer plein de choses autour. L’outil de traduction ce n’est que le premier. On commence par exemple à travailler sur la détection de personnage. On arrive à analyser la forme d’une bulle, à faire une distinction entre la bulle, l’appendice (NDLR : petite queue de la bulle qui pointe vers celui qui parle) et à relier le texte à la personne qui parle. Et à détecter le paterne graphique du personnage. Un peu comme les algorithmes de reconnaissance faciale, mais sur quelque chose de dessiné. On est en train de développer cela.


Interface de traduction de Geo Comix avec la retranscription de La Sentinelle du Petit Peuple ©Dupuis

Interface de Geo Comix avec la retranscription de La Sentinelle du Petit Peuple © Dupuis
© Geo Comix, éditions 2022


D.L : On pense utiliser avec des moteurs de recherche. Par exemple lorsqu’on tape Hulk dans la barre de recherche, on retrouve tous les Hulks reconnus par l’IA dans toutes les planches où il apparait. On pourra rentrer dans un livre par la case où Hulk apparait : ça pourrait aider par exemple quelqu’un qui fait une thèse sur Hulk, et qui cherche toutes ses apparitions. On exploite la sémantique des livres pour ouvrir de nouveaux usages qui n’existent pas encore.

Cela aiderait le référencement, cela permettrait de vendre les livres différemment, au-delà des mots clés du résumé ou des métadonnées. Cela aiderait aussi pour la recommandation des libraires, etc.


Comment facturez-vous ce service ?


S.P : Pour le moment le logiciel est réservé en offre professionnel à professionel, on a une facturation au volume.

D.L : On ne s’empêche pas d’évoluer peut-être un jour vers une offre d’abonnement. Quand le logiciel va évoluer vers une offre directement pour les traducteurs. On est sur une tarification au titre, qui dépend aussi du volume.


Pourquoi avoir choisi le nom « Geo Comix » ? Pour s’exporter plus facilement à l’international ?


S.P : L’IA s’appelle Geo depuis un moment, c’est une allusion à Géo Trouvetou mais qui n’est pas assumée parce qu’il y a des droits. Mais Geo c’est aussi géométrie, géographie.


Logo Geo Comix

Logo Geo Comix
© Geo Comix 2022


D.L : L’IA détecte la géographie de la planche. L’icône est une bulle avec une cible, on cible les éléments dans la planche.

S.P : Le Comix est pragmatique : oui, il y a une dimension internationale. On commence déjà à traiter des mangas. Le webtoon nous intéresse ! On a de quoi s'occuper !

Haut de page

Commentez

1200 caractères restants