Documentation de l'API d'Anonymisation
Aperçu
L'API d'Anonymisation est une solution complète de confidentialité des données conçue pour détecter et masquer les informations personnellement identifiables (PII) dans les documents provenant de diverses sources. Ce service puissant aide les organisations à se conformer aux réglementations de protection des données en identifiant et en anonymisant automatiquement les informations sensibles dans les données structurées et non structurées.
Fonctionnalités Clés
- Support Multi-Source : Connexion à diverses sources de données, y compris SharePoint, Google Drive, FTP, bases de données (PostgreSQL, MySQL, Oracle, SQL Server, SQLite), et fichiers locaux
- Détection Avancée de PII : Utilise à la fois des modèles regex et des modèles GLiNER affinés, spécialement entraînés sur les noms et villes béninois
- Flux de Travail Flexibles : Création de flux de travail d'anonymisation personnalisés avec plusieurs règles et configurations
- Traitement de Documents et Tableaux : Gestion des formats de données basés sur des documents et des tableaux
- Traitement en Temps Réel : Exécution de tâches d'anonymisation avec surveillance de l'état en temps réel
- Gestion des Utilisateurs : Authentification complète des utilisateurs et contrôle d'accès basé sur les rôles
- Gestion des Actifs : Organisation et suivi de vos actifs traités avec des métadonnées
- Système de Notification : Restez informé de la progression et de l'achèvement des tâches
Qu'est-ce qui est Anonymisé?
Le système est spécialement conçu pour détecter et masquer divers types de PII, notamment:
- Noms Personnels : Exploitation des modèles GLiNER affinés sur les conventions de nommage béninoises
- Informations Géographiques : Villes, adresses et données de localisation
- Modèles Personnalisés : Modèles regex définis par l'utilisateur pour des types de données spécifiques
- Données Sensibles : Toute information sensible correspondant à des modèles basés sur vos règles
Architecture
graph TD
A[Sources de Données] --> B[Connecteurs Source]
B --> C[Stockage d'Actifs]
C --> D[Moteur d'Anonymisation]
D --> E[Modèle GLiNER]
D --> F[Règles Regex]
E --> G[Sortie Anonymisée]
F --> G
G --> H[Stockage des Résultats]
Cas d'Utilisation
- Santé : Anonymisation des dossiers patients et des documents médicaux
- Services Financiers : Protection des données clients dans les rapports financiers
- Documents Juridiques : Expurgation des informations sensibles des documents juridiques
- Recherche : Nettoyage des ensembles de données pour la recherche académique ou commerciale
- Conformité : Répondre aux exigences du RGPD, HIPAA et autres réglementations
Stack Technologique
- Backend : FastAPI (Python)
- IA/ML : GLiNER pour la Reconnaissance d'Entités Nommées
- Authentification : OAuth2 avec jetons JWT
- Stockage : Stockage compatible S3 pour les actifs
- Base de Données : Support pour multiples backends de bases de données
- Conteneurisation : Déploiement prêt pour Docker
Démarrage
Prêt à protéger vos données sensibles ? Consultez notre Guide de Démarrage Rapide pour être opérationnel en quelques minutes, ou plongez dans la Référence API pour une documentation détaillée des points d'accès.
Besoin d'Aide ?
- 📖 Parcourez la documentation complète
- 🚀 Suivez le Guide de Démarrage Rapide
- 🔧 Découvrez les options de Déploiement
Développé par Bivariant, ASIN, et DWT - Engagés pour la confidentialité et la sécurité des données.