L'intelligence artificielle et l'apprentissage automatique sont sur toutes les lèvres. Mais à quel point les systèmes basés sur l'IA sont-ils vraiment intelligents et où peuvent-ils être utilisés efficacement dans le quotidien des entreprises ? Roger Egli, Solution Owner & Teamlead Input Management chez Arcplace, parle des réseaux neuronaux, de l'entraînement intensif des machines et des systèmes de réception du courrier qui reconnaissent l'état d'esprit d'un client.
L'intelligence artificielle et l'apprentissage automatique sont des méga-thèmes dans la recherche, mais aussi dans l'industrie. Grâce à un matériel nettement plus performant, les applications d'IA complexes et gourmandes en calcul trouvent de plus en plus leur place dans le monde des affaires. Les systèmes de reconnaissance de caractères et d'images, qui s'améliorent constamment, en sont une application typique. Chez Arcplace, nous utilisons principalement les technologies d'IA là où les informations physiques et électroniques doivent être classées, extraites et validées avec un degré élevé d'automatisation. Par exemple, dans le cadre de la réception numérique du courrier ou de la numérisation de grands fonds d'archives.
Non, et pas dans un avenir prévisible. Les systèmes actuels qui travaillent avec l'IA dépendent encore fortement des données d'entraînement. Contrairement au cerveau humain, ils ne peuvent pas classer et comprendre par eux-mêmes des informations jamais vues auparavant. Mais la recherche va bien sûr dans cette direction.
La méthode classique est bien illustrée par un système de capture. Celui-ci est alimenté en permanence par le plus grand nombre possible d'exemples de formulaires et d'informations visuelles. Si un nouveau document ou élément n'est pas reconnu, il est automatiquement transmis à un opérateur humain. Celui-ci classifie manuellement l'information et ajoute des informations si nécessaire. Le système se souvient de ces inputs et reconnaît ainsi de plus en plus de documents de manière autonome.
L'entraînement des systèmes de capture demande en effet beaucoup de temps et de ressources et constitue dans de nombreux cas un obstacle. Chez Arcplace, nous avons l'immense avantage de générer automatiquement des données d'entraînement pour les systèmes de nos clients dans notre puissant centre de numérisation et de BPO. Chaque cas douteux est évalué manuellement lors de la capture. Il en résulte une qualité de données très élevée. Grâce à la rétroaction, de moins en moins de cas douteux doivent être traités manuellement et la vitesse de traitement peut être augmentée.
Elle va dans le sens des réseaux neuronaux artificiels, pour lesquels on trouve constamment de nouveaux domaines d'application.
Il s'agit en quelque sorte d'une simulation du cerveau humain. Les neurones, c'est-à-dire les nœuds qui exécutent une fonction mathématique, sont disposés en couches. Chaque neurone d'une couche est relié à chaque neurone de la couche suivante. Chaque couche effectue une tâche partielle. Dans le cas de la reconnaissance de caractères ou d'images, la première couche analyse par exemple les valeurs de luminosité des pixels, la deuxième trouve des bords horizontaux, la troisième reconnaît les arrondis, la quatrième fait jouer des combinaisons des éléments trouvés, etc. À la fin du processus, qui devient de plus en plus complexe au fil des couches, la sortie se présente sous la forme du caractère ou du contenu de l'image correctement reconnu - espérons-le.
On montre par exemple au réseau neuronal l'image d'un chien. Il passe alors en revue de manière autonome des millions de possibilités à l'aide de grandes capacités de calcul et essaie de trouver de quelle information d'image il pourrait s'agir. Sans entraînement préalable, les résultats sont d'abord insatisfaisants. Le système dit chaise, nuage, pieuvre... Lors du processus d'apprentissage, tous les neurones impliqués sont pris en compte. Ceux-ci sont modifiés de manière à ce qu'à la fin, la prédiction soit correcte. En poursuivant l'entraînement, la qualité de l'extraction peut être progressivement améliorée. Les jeux de données doivent être aussi équilibrés et variés que possible. Si nous avons 1000 images de chaises mais seulement 10 images similaires de chiens, l'apprentissage fonctionne mal, car le système reconnaît surtout les différences. Comme l'arrière-plan est vert sur de nombreuses images de chiens, le système définirait le vert comme caractéristique du chien, ce qui est bien sûr faux. L'objectif est que l'IA - de manière analogue à nous, les humains - reconnaisse le chien à partir de caractéristiques telles que la forme du corps, les oreilles, les yeux, le pelage, etc. indépendamment de l'environnement dans lequel il a été photographié.
Cette technologie permet déjà d'obtenir des taux de reconnaissance de plus de 99 % pour les informations manuscrites et offre d'énormes possibilités en matière de reconnaissance d'images. Mais : même les réseaux neuronaux ont d'abord besoin d'un entraînement intensif.
« Le 'Natural Language Processing', ou NLP, est un autre développement passionnant. Il s'agit ici de permettre aux systèmes de captation de lire l'état d'esprit de l'expéditeur. »
Le « Natural Language Processing », ou NLP, est un autre développement passionnant. Il s'agit ici de permettre aux systèmes de captation de lire l'état d'esprit de l'expéditeur. Le client fait-il un compliment ou se plaint-il ? Si de tels aspects émotionnels sont reconnus dans le courrier entrant, les demandes peuvent être triées par ordre d'urgence et les cas importants peuvent être traités en priorité.
Nous sommes sur le point de mettre en service chez un gros client une solution de capture basée sur un réseau neuronal artificiel. Nous espérons que cette nouvelle technologie permettra d'améliorer encore la qualité de l'extraction et donc de rendre la capture encore plus efficace. Dans ce cas, il s'agit de numériser une archive papier contenant des millions de documents. Avec un tel volume, chaque seconde économisée compte.