Documentation de l'API d'Anonymisation

Aperçu

L'API d'Anonymisation est une solution complète de confidentialité des données conçue pour détecter et masquer les informations personnellement identifiables (PII) dans les documents provenant de diverses sources. Ce service puissant aide les organisations à se conformer aux réglementations de protection des données en identifiant et en anonymisant automatiquement les informations sensibles dans les données structurées et non structurées.

Fonctionnalités Clés

Support Multi-Source : Connexion à diverses sources de données, y compris SharePoint, Google Drive, FTP, bases de données (PostgreSQL, MySQL, Oracle, SQL Server, SQLite), et fichiers locaux
Détection Avancée de PII : Utilise à la fois des modèles regex et des modèles GLiNER affinés, spécialement entraînés sur les noms et villes béninois
Flux de Travail Flexibles : Création de flux de travail d'anonymisation personnalisés avec plusieurs règles et configurations
Traitement de Documents et Tableaux : Gestion des formats de données basés sur des documents et des tableaux
Traitement en Temps Réel : Exécution de tâches d'anonymisation avec surveillance de l'état en temps réel
Gestion des Utilisateurs : Authentification complète des utilisateurs et contrôle d'accès basé sur les rôles
Gestion des Actifs : Organisation et suivi de vos actifs traités avec des métadonnées
Système de Notification : Restez informé de la progression et de l'achèvement des tâches

Qu'est-ce qui est Anonymisé?

Le système est spécialement conçu pour détecter et masquer divers types de PII, notamment:

Noms Personnels : Exploitation des modèles GLiNER affinés sur les conventions de nommage béninoises
Informations Géographiques : Villes, adresses et données de localisation
Modèles Personnalisés : Modèles regex définis par l'utilisateur pour des types de données spécifiques
Données Sensibles : Toute information sensible correspondant à des modèles basés sur vos règles

Architecture

graph TD
    A[Sources de Données] --> B[Connecteurs Source]
    B --> C[Stockage d'Actifs]
    C --> D[Moteur d'Anonymisation]
    D --> E[Modèle GLiNER]
    D --> F[Règles Regex]
    E --> G[Sortie Anonymisée]
    F --> G
    G --> H[Stockage des Résultats]

Cas d'Utilisation

Santé : Anonymisation des dossiers patients et des documents médicaux
Services Financiers : Protection des données clients dans les rapports financiers
Documents Juridiques : Expurgation des informations sensibles des documents juridiques
Recherche : Nettoyage des ensembles de données pour la recherche académique ou commerciale
Conformité : Répondre aux exigences du RGPD, HIPAA et autres réglementations

Stack Technologique

Backend : FastAPI (Python)
IA/ML : GLiNER pour la Reconnaissance d'Entités Nommées
Authentification : OAuth2 avec jetons JWT
Stockage : Stockage compatible S3 pour les actifs
Base de Données : Support pour multiples backends de bases de données
Conteneurisation : Déploiement prêt pour Docker

Démarrage

Prêt à protéger vos données sensibles ? Consultez notre Guide de Démarrage Rapide pour être opérationnel en quelques minutes, ou plongez dans la Référence API pour une documentation détaillée des points d'accès.

Besoin d'Aide ?

📖 Parcourez la documentation complète
🚀 Suivez le Guide de Démarrage Rapide
🔧 Découvrez les options de Déploiement

Développé par Bivariant, ASIN, et DWT - Engagés pour la confidentialité et la sécurité des données.