EzPC : la tentative de Microsoft d’améliorer la sécurité des données dans la validation des modèles d’IA

EzPC : la tentative de Microsoft d’améliorer la sécurité des données dans la validation des modèles d’IA

Ceux qui ont travaillé dans le domaine de la science des données savent que le développement d’un modèle d’intelligence artificielle (IA) implique généralement trois étapes de haut niveau : la formation, la validation et les tests. Lors du test de la précision d’un modèle, il y a généralement de nombreuses considérations lors du choix d’un ensemble de test pour le réglage des hyperparamètres. Les organisations ont tendance à utiliser certaines de leurs données réelles pour la validation afin d’évaluer avec précision les modèles, mais il existe naturellement de nombreux problèmes de sécurité et de confidentialité, en particulier lorsqu’il s’agit d’informations personnellement identifiables (PII).

Si votre modèle est développé par une entreprise extérieure, vous avez essentiellement deux options. Soit l’entreprise partagera son modèle avec vous, ce qui pourrait compromettre sa propriété intellectuelle, soit vous partagerez vos données réelles avec elle, ce qui présente un risque pour votre vie privée et peut conduire à un surajustement du modèle aux données réelles. Il existe de nombreux obstacles juridiques à surmonter lors de l’un de ces choix difficiles. Ainsi, alors que les organisations souhaitent adopter l’IA le plus rapidement possible, elles sont confrontées à des défis lorsqu’elles traitent des données, que le processus de développement de modèles soit interne ou externe.

Pour résoudre ce problème, Microsoft travaille sur un nouveau framework appelé EzPC , qui signifie « Easy Secure Multi-party Computation ». EzPC est essentiellement basé sur Secure Multiparty Computing (MPC). MPC permet à plusieurs parties de calculer conjointement une fonction en utilisant la cryptographie sans exposer leurs données les unes aux autres.

Bien que MPC existe depuis de nombreuses années, il s’est avéré difficile à mettre en œuvre en raison des difficultés à le rendre évolutif et efficace pour plusieurs fonctions. EzPC résout ces problèmes en utilisant MPC comme élément de base et en permettant aux développeurs, et pas seulement aux experts en cryptographie, d’étendre ses capacités. Selon Microsoft :

L’EzPC est basé sur deux innovations. Tout d’abord, un compilateur modulaire appelé CrypTFlow prend en entrée le code TensorFlow ou Open Neural Network Exchange (ONNX) pour l’inférence ML et génère automatiquement du code de type C, qui peut ensuite être compilé dans divers protocoles MPC. Ce compilateur prend en charge MPC et est optimisé pour l’efficacité et l’évolutivité des protocoles MPC. La deuxième innovation est un ensemble de protocoles cryptographiques hautes performances pour le calcul sécurisé de fonctions complexes d’apprentissage automatique.

Microsoft s’est vanté que l’EzPC a fourni « la toute première validation sécurisée d’un modèle d’IA de production » lors de tests avec des chercheurs de l’Université de Stanford, prouvant que vous n’avez pas besoin d’échanger des données pour effectuer la validation. Bien que le modèle EzPC de Microsoft ait nécessité 15 minutes pour une inférence sécurisée avec un élément de validation – qui est 3 000 fois plus long que l’inférence normale – sur « deux VM cloud standard », la société affirme que cela n’a pas d’importance, car le parallélisme de calcul peut résoudre ce problème. problème. Selon la méthodologie actuelle, plus de 500 images de l’ensemble de validation ont été déduites en cinq jours pour un coût total inférieur à 100 $. Microsoft affirme qu’il pourrait terminer la sortie de l’ensemble en 15 minutes, si toutes les données étaient traitées en parallèle. Vous pouvez explorer les résultats dans un article publié ici .

À ce titre, Microsoft encourage l’utilisation de l’EzPC en mettant l’accent sur son fondement dans MPC. Les organisations qui utilisent l’EzPC pourront également contourner les obstacles juridiques en s’assurant que le modèle d’IA est évalué avec précision avant d’être utilisé dans des environnements de production. EzPC est un framework open source que vous pouvez trouver sur GitHub ici . Vous pouvez également suivre les derniers développements de cette initiative ici et lire des articles de recherche sur ce sujet ici .

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *