Comprendre le Machine Learning

Big Data, Machine Learning... Vous entendez ces mots un peu partout sans trop comprendre ce qui se trame derrière. Pourtant, la tech, ça vous connaît. Mais vous n’avez peut-être jamais vraiment cherché à comprendre précisément comment fonctionnait le Machine Learning (ou « apprentissage automatique »), car cela ne relève pas de votre spécialité. Puisqu’il n’est pas interdit de se cultiver sur les technologies d’intelligence artificielle, quel que soit notre métier, voici notre article qui vous aidera on l’espère à cerner le principe du Machine Learning, et à comprendre son lien étroit avec le Big Data.

Qu’est-ce que le Machine Learning, ou « Apprentissage automatique » ?

En soit, le Machine Learning n’est pas nouveau. Mais on ne commence à s’y intéresser de près que depuis quelques années, car les possibilités qu’il offre sont désormais colossales. Sa définition n’est, en tant que telle, pas spécialement complexe : il s’agit d’une technologie permettant d’effectuer des prédictions. Pour cela, elle se base sur du forage de données, de la reconnaissance de patterns, des statistiques, et des analyses prédictives. Le plus connu des algorithmes de Machine Learning est Perceptron.

Beaucoup se demandent quel est précisément le lien entre Big Data et Machine Learning. Ce qu’il faut principalement comprendre, c’est que la technologie de Machine Learning est particulièrement efficace pour trouver des solutions à partir de données nombreuses, diverses, et changeantes, que seul le Big Data permet de stocker.

L’intérêt d’utiliser le Machine Learning avec le Big Data

Pour comprendre pleinement l’intérêt du Machine Learning, encore faudrait-il cerner celui du Big Data. Encore un mot employé à tort et à travers qui commence à en énerver certains, à faire peur à d’autres, que tout le monde connaît, mais que finalement très peu de gens comprennent.

Alors, qu’est-ce que le Big Data ? Le terme signifie littéralement mégadonnées, ou données massives. On l’aura compris, il sert donc à gérer et à analyser de très gros volumes de données. On ne peut en donner de définition plus précise – et c’est sans doute la raison pour laquelle il demeure un tel flou – car son usage et son utilité dépend entièrement des acteurs du marché qui la conçoivent ou l’utilisent.

Pour exploiter la valeur du Big Data en cherchant à comprendre et à analyser des données, les outils traditionnels analytiques ne sont pas suffisamment performants : le volume de données est si important qu’il est trop difficile de tester toutes les hypothèses et d’en faire des déductions intelligentes. Hadoop est la principale plateforme d'exploitation des données.

A lire également : Comprendre le Big Data

Les outils de business intelligence (BI) et de reporting permettent simplement de faire des comptes et d’effectuer des requêtes SQL. Leur traitement analytique nécessite l’intervention d’un humain, afin de spécifier ce qui doit être calculé.

Le Machine Learning, lui, permet d’extraire la valeur de ces données sans intervention humaine. Contrairement aux outils d’analyse basiques, celui-ci est idéal pour analyser des données à la fois complexes et massives. Avec le machine learning, plus les données sont nombreuses, plus le système peut apprendre, progresser, et trouver des résultats de qualité. Voilà précisément pourquoi on parle d’apprentissage automatique.

Le Machine Learning est donc de plus en plus populaire, en particulier dans les écoles où les masters spécialisés se multiplient. Python est l’un des meilleurs langages pour débuter l’apprentissage automatique. Le Langage R est également très utilisé. Les deux ont des avantages et des inconvénients : Python est plus simple d’apprentissage, et s’adapte mieux à la manipulation de données et aux tâches répétitives. R, quant à lui, est plus adapté aux projets lourds en statistiques et pour explorer ponctuellement des ensembles de données. Mais R ne s’utilise qu’en Big Data, tandis que Python pourra également s’utiliser en développement web. Si vous êtes développeur web et que l’intelligence artificielle vous intéresse, il peut donc être intéressant de vous mettre tout doucement au Python.

Peut-on faire du Machine Learning sans Big Data ?

Et la réponse est...non. Mais si on a bien lu jusqu’ici, on aura compris !

Tout l’intérêt du Machine Learning est de permettre au système de devenir de plus en plus intelligent. Pour cela, celui-ci a besoin d’être « nourri » avec un nombre de données croissantes, pour en analyser toujours plus. Le Big Data est donc l’outil indispensable au Machine Learning et à toutes les technologies d’intelligence artificielle (IA).

Aujourd’hui, celles-ci arrivent à apprendre sans l’aide d’un humain et accèdent à un volume colossal de données en temps réel. L’analyse se fait de manière quasi instantanée, tant l’IA est devenue agile.

Quelques cas d’usage du Machine Learning

Il est toujours plus facile de comprendre l’intérêt d’une techno avec quelques exemples d’applications.
Un premier exemple de l’intérêt du Machine Learning est la facilitation de détection des fraudes. Chaque changement de comportement de consommation peut désormais être facilement analysé et les fraudes bancaires sont désormais très rapidement détectées par les algorithmes.

En e-commerce, le Machine Learning est précieux pour le retargeting : en fonction de l’historique des produits consultés, achetés, et des requêtes tapées par l’internaute, les recommandations d’achat permettront au client d’être ciblé avec des produits qui l’intéressent. Netflix utilise cette technique pour recommander des films correspondant aux goûts cinématographiques de ses clients. Amazon décuple également cette vente grâce à un targeting ultra-ciblé.

Quid du Deep Learning ?

On entend souvent parler du Deep Learning, certains se demandant alors la différence entre Machine Learning et Deep Learning. Les deux n’ont pas à être distingués, puisque le Deep Learning est en réalité une sous-catégorie de Machine Learning. Le Deep Learning concerne par exemple tout ce qui est lié à la reconnaissance visuelle ou vocale. Elle sera particulièrement utile en cas d’enquête policière pour reconnaître un visage sur une caméra de surveillance, mais également pour des cas plus courants, comme pour développer les chatbots conversationnels (Siri, Alexa, etc.).

Le Deep Learning cherche à reproduire un réseau neuronal tel que celui-ci existe dans la nature : très souvent, il s’agit de chercher à reproduire un comportement humain. L’apprentissage est ici supervisé : on va définir ce que l’on souhaite apprendre au robot. Si vous êtes fan de la série WestWorld, on est en plein dedans, puisque les robots sont créés à l’image des humains et respectent (au début de la série, en tout cas...) un scénario spécifiquement écrit. Pour que le robot apprenne à improviser et sache se nourrir de nouvelles informations à partir de ses observations, on aura besoin d’une puissance de calcul beaucoup plus élevée.

Vous avez désormais les bases du Machine Learning. La réalité est bien sûr nettement plus complexe et vous pouvez diversifier vos recherches sur Lebigdata.fr ou encore Bial-r. Sur OpenClassrooms, vous pouvez mettre un peu plus les mains dans le cambouis.

L'auteur Julien Broue

Co-Founder

Retourner aux articles