Machine Learning
Des balbutiements à aujourd'hui
Pour mon sujet de veille technologique j'ai décider de parler du machine learning (apprentissage automatique en français). Le machine learning est un champ d'étude de l'intelligence de l'intelligence artificielle et nous allons observer son évolution de ces premières apparitions à aujourd’hui.
I- Définition
II- Application
III- Les types d'apprentissages
IV- Prospective
V- Annexes
VI- Sources

I- Définition
Qu'est-ce que le machine learning ?
Si le Machine Learning ne date pas d’hier, sa définition précise demeure encore confuse pour de nombreuses personnes. Concrètement, il s’agit d’une science moderne permettant de découvrir des patterns(voir annexe) et d’effectuer des prédictions à partir de données en se basant sur des statistiques, sur du forage de données, sur la reconnaissances de patterns et sur les analyses prédictives.
​
L'analyse peut concerner des graphes, arbres, ou courbes (par exemple, la courbe d'évolution temporelle d'une mesure ; on parle alors de données continues, par opposition aux données discrètes associées à des attributs-valeurs classiques) au même titre que de simples nombres.
Big-Data et machine learning
Le Machine Learning est très efficace dans les situations où les insights doivent être découvertes à partir de larges ensembles de données diverses et changeantes,

autrement dit : le Big Data(voir annexe). Pour l’analyse de telles données, le Machine Learning se révèle nettement plus efficace que les méthodes traditionnelles en termes de précision et de vitesse. Sans le Big Data, le Machine Learning et l’intelligence artificielle ne seraient rien. Les données sont l’instrument qui permet à l’IA de comprendre et d’apprendre à la manière dont les humains pensent. C’est le Big Data qui permet d’accélérer la courbe d’apprentissage et permet l’automatisation des analyses de données. Plus un système Machine Learning reçoit de données, plus il apprend et plus il devient précis.
Ont peut donc en conclure que le Big Data et le Machine Learning sont deux choses indisociable
II- Application
Le Machine Learning permet de doter les ordinateurs et les machines systèmes de plusieurs avantages:
-
D'une perception de leur environnement.
-
D'une vision leur permettant la reconnaissance d'objets (visages, schémas, langages naturels, écriture, formes syntaxiques…).
-
D'aide aux diagnostics, médical notamment, bio-informatique...
-
D'interface cerveau-machine.
-
D'analyse financière, dont analyse du marché boursier ...
-
De classification des séquences d'ADN et plein d'autres.

Exemples d'application
Prédiction des prix
L’algorithme va estimer la valeur de quelque chose (le prix d’une maison, ou les gains espérés d’une boutique …) en fonction des observations précédentes. Par exemple, estimer le prix d’une maison en fonction de sa superficie, sa localisation, possibilité de Parking ou non etc… Ces estimations sont faites en observant d’autres produits similaires pour en tirer des conclusions.
Diagnostique médical
En se basant sur les données médicales d’un patient, l’algorithme peut diagnostiquer si le sujet est atteint d’une maladie donnée. Parfois, ces algorithmes peuvent alerter d’un incident grave de santé avant que cela n’arrive, notamment pour les crises cardiaques.
Cyber-sécurité
L’accroissement du nombre et de la complexité des malwares ne font qu’augmenter de jour en jour. Certaines entreprises notamment DeepInstinct, se base sur le Deep Learning (Une branche du Machine Learning) pour offrir une solution de cyber-défense. La solution de DeepInstinct se base sur la reconnaissance des routines d’appels (l’activité d’un programme) pour décider s’il s’agit d’un programme malicieux ou non.
III- Les types d’apprentissages
Les algorithmes d'apprentissage peuvent se catégoriser selon le mode d'apprentissage qu'ils emploient, il en existe 2 principales qui sont:
​
-
​L'apprentissage supervisé - Dans le cas de l’apprentissage supervisé, la robustesse de l’algorithme dépendra de la précision de son entrainement. Un algorithme apprenant des contenues supervisés produit une carte interne qui permet sa réutilisation pour classifier de nouvelles quantités de données. Lors de la première phase, il s'agit de déterminer un modèle des données étiquetées. La seconde phase (dite de test) consiste à prédire l'étiquette d'une nouvelle donnée, connaissant le modèle préalablement appris. Pour mieux le visualiser prenons l’exemple d’un algorithme qui détecte les visages, un utilisateur devra lui montrer ce qu’est un visage et ce qui ne l’est pas afin qu’il puisse apprendre et prédire si les prochaines photos le sont ou non. En résumé, l’algorithme apprend sur des exemples, dans le cas de cette utilisation les exemples ont besoin d’être étiqueté afin d’assurer l’efficacité de son apprentissage.
​

-
L'apprentissage non supervisé - Dans le cas de l’apprentissage non-supervisé, il n’y a pas besoin de l’intervention d’un être humain, car l’algorithme va par lui-même comprendre comment différencier un visage d’un paysage en cherchant leurs corrélations. Étant donné qu’un algorithme ne peut pas tout simplement savoir ce qui constitue un visage, la méthode non-supervisé va donc partitionner et classer les données dans des groupes homogènes, c'est ce qu'on appelle le Clustering.
Différences entre supervisé et non supervisé
La différence distinct entre l’apprentissage supervisé à l’apprentissage non-supervisé est le fait que l’apprentissage non-supervisé cherche à trouver des partitions de modèles par lui-même, l’extraction des données est donc descriptive.
L’apprentissage supervisé est utilisé quand l’utilisateur sait labelliser les informations, l’extraction des données est donc prédictive.

Autres types d'apprentissage
-
L'apprentissage semi-supervisé - Effectué de manière probabiliste ou non, il vise à faire apparaître la distribution sous-jacente des exemples dans leur espace de description. Il est mis en œuvre quand des données (ou « étiquettes ») manquent… Le modèle doit utiliser des exemples non étiquetés pouvant néanmoins renseigner. Exemple : En médecine, il peut constituer une aide au diagnostic ou au choix des moyens les moins onéreux de tests de diagnostic
-
L'apprentissage par renforcement - l'algorithme apprend un comportement étant donné une observation. L'action de l'algorithme sur l'environnement produit une valeur de retour qui guide l'algorithme d'apprentissage. Exemple : L'algorithme de Q-learning5 est un exemple classique. (voir Annexe)
-
L'apprentissage par transfert - L’apprentissage par transfert peut être vu comme la capacité d’un système à reconnaître et appliquer des connaissances et des compétences, apprises à partir de tâches antérieures, sur de nouvelles tâches ou domaines partageant des similitudes
IV- Prospective
Reprenons depuis le début et retraçons l'évolution du Machine Learning en commençant par le commencement.
​
Dans les années 2000-2010, l'apprentissage automatique est encore une technologie émergente ,mais polyvalente qui est par nature théoriquement capable d'accélérer le rythme de l'automatisation et de l'autoaprentissage lui-même. Combinée à l'apparition de nouveaux moyens de produire, stocker et faire circuler l'énergie, à l'informatique ubiquiste(voir Annexe) il pourrait bouleverser les technologies et la société (comme l'ont fait la machine à vapeur et l'électricité, puis le pétrole et l'informatique lors des révolutions industrielles précédentes.
​​
L'apprentissage automatique pourrait générer des innovations et des capacités inattendues, mais avec un risque selon certains observateurs de perte de maitrise de la part des humains sur de nombreuses tâches qu'ils ne pourront plus comprendre et qui seront faites en routine par des entités informatiques et robotisées. Ceci laisse envisager des impacts spécifiques complexes et encore impossibles à évaluer sur l'emploi, le travail et plus largement l'économie et les inégalités.
​​
L'apprentissage automatique reste avant tout un sous-domaine de l'informatique, mais il est étroitement lié opérationnellement aux sciences cognitives, aux neurosciences, à la biologie et à la psychologie, et pourrait à la croisée de ces domaines, nanotechnologies, biotechnologies, informatique et sciences cognitives, aboutir à des systèmes d'intelligence artificielle ayant une assise plus vaste.

V- Annexes
-
Patterns - Le mot anglais « pattern » est souvent utilisé pour désigner un modèle, une structure, un motif, un type, etc. Il s'agit souvent d'un phénomène ou d'une organisation que l'on peut observer de façon répétée lors de l'étude de certains sujets, auquel il peut conférer des propriétés caractéristiques.
-
Big Data - Littéralement, ces termes signifient mégadonnées, grosses données ou encore données massives. Ils désignent un ensemble très volumineux de données qu’aucun outil classique de gestion de base de données ou de gestion de l’information ne peut vraiment travailler.
-
L'algorithme de Q-learning5 - Cette méthode d'apprentissage peut être appliquée pour trouver une suite d'actions associées à des états (politique) d'un processus de décision markovien (fini) quelconque. Cela fonctionne par l'apprentissage d'une fonction de valeur d'état qui permet de déterminer le potentiel bienfait (récompense) de prendre une certaine action dans un certain état en suivant une politique optimale.
-
Informatique ubiquiste - L'ubiquité ou l'omniprésence est la capacité d'être présent en tout lieu ou en plusieurs lieux simultanément.
VI- Sources

De Araujo Antoine - 2018