Instagram

Instagram did not return any images.

Lettre d’information

Logo NOVASECUR

RSS Flux RSS de l’IFACI

Calendrier

janvier 2019
L M M J V S D
« Nov    
 123456
78910111213
14151617181920
21222324252627
28293031  

Extraction de connaissances

//Extraction de connaissances

Extraction de connaissances et exploration de données

Définition

L’exploration de données, connue sous l’expression d’extraction de connaissances à partir de données, « ECD » en français, « Knowledge Data Discovery – KDD » en anglais, a pour objet l’extraction d’un savoir ou d’une connaissance à partir de grandes quantités de données, par des méthodes mathématiques, automatiques ou semi-automatiques.

Utilisation

L’utilisation industrielle ou opérationnelle de ce savoir dans le monde professionnel permet de résoudre des problèmes très divers, allant de la gestion des risques à la maintenance préventive, en passant par la détection de fraudes ou encore l’optimisation de processus.

Objectifs

L’exploration de données alimente des tableaux de bord d’informatique décisionnelle pour les dirigeants. Elle est l’activité de base sur laquelle se fonde les informations necessaires au pilotage de l’entreprise et elle permet d’anticiper certains faits.

En quelques mots, elle identifie un fait et l’explique par classification.

L’information peut être déclinée par produits, risque ou fraude, puis elle précise les variables ou les paramètres qui expliquent le fait identifié. A titre d’exemple, pourquoi le risque de fraude de tel point de vente est il supérieur à celui d’un autre.

Détermination par objectif

De nos jours, les techniques d’exploration de données peuvent être utilisées dans des domaines complètement différents avec des objectifs bien spécifiques. Par exemple, analyse des comportements pour dégager des similarités, définir des profils.

Le profilage

Le profilage est particulièrement utilisé par les services de renseignements de tous les pays cherchant à caractériser les crimes (répondre à la question : « Qu’est-ce qu’un crime « normal » ? ») et les réseaux criminels (répondre à la question : « qu’est-ce qu’un comportement criminel « normal » ? »). Leur utilisation permet d’aider la prévention et limiter les risques et les dangers. Plusieurs de ces techniques de Datamining sont utilisées par Novasecur. Elles permettent de définir des « profils » qui servent de référence de comparaison pour l’analyse de risque.

Data profiling
Scoring

Le scoring

Le scoring ou score des résultats est maintenant très connu des banques. Novasecur utilise un scoring des résultats de règles métiers « événements » qui permet de repérer les mauvaises associations de données « événements » , avec un facteur de risque important (évaluation des risques-événement). Une alerte est attribuée à cet « événement », et visible sur les tableaux de bord.

D’autres exemples dans d’autres domaines pourraient être trouvés, notamment dans les modèles issus des sciences fondamentales qui ont beaucoup inspiré les travaux de recherche de Novasecur. Dans la recherche du génome humain, les techniques d’exploration de données sont utilisées pour découvrir les gènes et leur fonction.

Toutes ces utilisations permettent de caractériser un phénomène complexe (comportement humain, dysfonctionnement, présence d’un risque, détection de fraude, ajustement des critères d’analyse à une situation nouvelle, etc) avec pour objectifs :

  • Augmenter la compréhension du phénomène afin de réduire les coûts de recherche ou d’exploitation liés
  • Améliorer la qualité des processus liés à ce phénomène.

Les systèmes de Novasecur associent plusieurs techniques (dont les précédentes) dans leurs modules de détection, leurs modèles prédictifs, leurs modules de gestion des plans d’actions, et les multiples représentations sous forme de tableau de bord et d’outils inédits d’aide à la décision.

Détermination par secteur d’activité

L’industrie a pris conscience de l’importance du patrimoine constitué par ses données et cherche à l’exploiter en utilisant l’informatique décisionnelle et l’exploration des données.

Les compagnies les plus avancées dans ce domaine se situent dans le secteur tertiaire, le marketing et les fonctions du risque ou de l’audit et du contrôle.

Influence du contexte et règles métiers

Pertinence des résultats

La pertinence des résultats de l’extraction de connaissances dépend aussi de la définition du contexte.

Contexte des résultats

C’est pour cette raison que les règles métiers de Novasecur accompagnent celles de ses clients afin de créer un maillage d’analyses spécifiques. En revanche, les modules de Datamining analysent mathématiquement et objectivement les jeux de données sujets à analyse.

L’interprétation seule des résultats en fonction d’autres cas similaires, mais différents, est cause d’erreurs.
Ce n’est pas propre aux raisonnements liés à l’exploration de données.
L’extrapolation sur des résultats obtenus à partir d’espaces de faibles dimensions peut aussi conduire à des erreurs.

Interprétation humaine

Aucun logiciel n’est auto-suffisant et rien ne remplacera le travail d’une personne connaissant le métier duquel sont extraites les données. L’analyse humaine reste donc nécessaire pour interpréter au mieux les livrables du logiciel.

En revanche, l’ergonomie simplifiée de Novasecur permet à des équipes non expertes d’extraire aisément les informations clés.

Objectifs de Novasecur

L’objectif de Novasecur est donc bien de permettre de concentrer le travail humain sur des opérations à forte valeur ajoutée, comme l’analyse et l’optimisation des stratégies de gestion des risques, sans l’intervention obligatoire de techniciens informatiques, statisticiens ni experts de la fouille de données.

Qualité et performance des outils d’extraction de connaissances MyNovasecur

Les solutions MyNovasecur reposent sur des modèles rapides et robustes, dont le taux d’erreur est le plus bas possible. Elles s’adaptent aux fluctuations de l’échantillon et supportent des changements lents ou rapides, intervenants sur les données.

Simples et compréhensibles, les outils Novasecur augmentent la lisibilité et l’interprétation des résultats. MyNovasecur est paramétrable afin d’être réutilisable sur plusieurs problématiques grâce à une ergonomie simplifiée et de multiples fonctions dynamiques (tableaux de bords interactifs, zoom sur données, continuité des pistes de recherches,…).