Dans cet article, je parlerai de la manière d'assurer la croissance des données d'IA avec un stockage objet évolutif.
Le volume de données continue de croître à une vitesse vertigineuse, et avec lui la pression de stocker en toute sécurité de grandes quantités de grands ensembles de données. Environ 200 zettaoctets de stockage de données Ils existent désormais et la plupart de ces données doivent sans doute être protégées. D'ici 2030 estimations sont que le volume de données augmentera jusqu'à environ 660 zettaoctets.
Le traitement des données non structurées par l'IA et la GenAI est en grande partie à l'origine de cette croissance, offrant à la nouvelle génération d'acteurs de la menace une nouvelle opportunité de ciblage : les grands modèles linguistiques riches en données (LLM). Les entreprises se rendent compte qu’il n’est pas possible de stocker en toute sécurité ces grands ensembles de données, ainsi que des volumes croissants d’autres données sensibles, avec les méthodes traditionnelles.
Ils mettent en œuvre un stockage objet avec une mise à l'échelle multidimensionnelle pour fournir la couverture et l'évolutivité dont ils ont besoin pour se défendre contre les attaques. C'est une tempête qui s'intensifie, car les acteurs de la menace utilisent désormais l'IA pour exécuter leurs menaces, les retournant ainsi contre eux-mêmes. La lutte contre ces acteurs nécessitera une méthode de stockage conçue pour prendre en charge de grands ensembles de données et réduire les risques dans toutes les dimensions par lesquelles les données transitent.
Pourquoi le stockage objet est-il pertinent ?
Les entreprises se sont tournées vers le stockage objet comme méthode privilégiée pour protéger les niveaux historiques de données sur site, comme cela s'est déjà produit dans le cloud public avec des services comme AWS S3.
Contrairement aux méthodes traditionnelles telles que le stockage par blocs ou par fichiers, l’architecture de stockage objet traite les données comme quelque chose de distinct. objets composé des données elles-mêmes ainsi que d'attributs descriptifs ou de métadonnées. Les riches métadonnées de chaque objet peuvent inclure des centaines d'attributs (étiquettes de sécurité, règles de conformité et même étiquettes d'ensemble de données IA), ce qui les rend idéales pour des ensembles de données diversifiés et à grande échelle.
Les objets sont stockés dans des conteneurs logiques appelés buckets et l'accès s'effectue via des API, ce qui facilite l'intégration de lacs de données ou de charges de travail d'analyse et d'intelligence artificielle. Contrairement au stockage en bloc traditionnel, par exemple, qui permet des modifications directes de fichiers, les API de stockage d'objets établissent des barrières pour rendre difficile la réussite d'un acteur malveillant. Pour accéder aux données, il faudrait écraser un objet ou écrire un objet modifié.
Un autre aspect clé est la base AWS S3 du stockage objet. Amazon Simple Storage Service (S3) est l'API standard de l'industrie largement adoptée pour stocker, mettre à l'échelle et récupérer efficacement les données du cloud et du stockage d'objets sur site. AWS3 est reconnu pour avoir contribué à faire du stockage d'objets une solution privilégiée pour la gestion et la récupération de données non structurées.
Riposter grâce à une mise à l’échelle multidimensionnelle
La mise à l'échelle multidimensionnelle est une capacité des principaux systèmes de stockage d'objets qui offre de nouveaux niveaux d'adaptabilité pour la croissance future. MDS part du principe que s'il ne peut pas évoluer efficacement pour suivre des flux de données élevés, gérer et surveiller des flux de données volumineux et authentifier l'accès, les données ne peuvent pas être protégées. MDS résout ce problème en évoluant pour prendre en charge un nombre croissant d'utilisateurs, d'applications, de capacité de stockage, de métadonnées, de performances et d'opérations de sécurité.
Les façons dont cette dimension de MDS peut améliorer la sécurité des données sont les suivantes :
Mise à l'échelle des opérations de sécurité par seconde. L'accès à S3 nécessite des contrôles d'authentification des utilisateurs et des demandes de politique de sécurité à chaque interaction API. Ces opérations de sécurité deviennent rapidement une perte importante de ressources et de calcul pour les systèmes de stockage, car la plupart des systèmes n'offrent pas de moyen de faire évoluer ces services de manière indépendante. Les utilisateurs du cloud peuvent générer des millions de requêtes par seconde sur l'infrastructure de stockage, et chaque requête d'API nécessite une authentification de l'utilisateur ainsi qu'une vérification et une évaluation complexes des politiques d'accès pour se protéger contre les violations de la confidentialité des données. Cependant, dans les environnements de cloud public et privé, l’application de ces protocoles de sécurité est essentielle à la défense de la cybersécurité. Une solution moderne mise en œuvre avec une mise à l’échelle multidimensionnelle peut faire évoluer un service de sécurité désagrégé indépendamment des autres opérations de stockage. Vous pouvez évoluer en fonction du volume nécessaire et répondre à la demande des utilisateurs sans sacrifier les performances.
Gestion et performances à l’échelle. La surveillance des performances de sécurité et de stockage liées au flux continu de données non structurées et la nécessité de gérer les compartiments S3 pour la sécurité et la gestion du cycle de vie présentent des défis opérationnels clés pour le personnel de sécurité et informatique. Pour gérer avec succès ce déluge de données, le personnel peut faire évoluer efficacement des fonctions telles que la surveillance des performances et la journalisation des activités. En automatisant les tâches, le personnel gagne du temps et anticipe les problèmes, y compris les événements qui pourraient indiquer une cybermenace.
Lorsque les compartiments S3 pourront atteindre des millions dans les cas d'utilisation de la sauvegarde en tant que service, le service informatique sera prêt à adopter une meilleure approche de la gestion des politiques spécifiques aux compartiments, telles que la sécurité et le cycle de vie. Le service informatique veut éviter de respecter des limites strictes sur le nombre de compartiments et de taxer les performances d'un système de stockage. Une approche plus récente consiste à utiliser une architecture distribuée et un stockage flash pour permettre une évolution vers des millions de compartiments, maintenir une faible latence et garantir des performances élevées.
Conquérir l’avenir avec une sécurité évolutive
L’utilisation croissante de l’IA pour exécuter des cyberattaques coûteuses et le volume croissant d’IA, de GenAI et de données non structurées nous poussent à examiner de meilleures façons de gérer et de protéger les données.
Les attributs de stockage et de mise à l'échelle d'objets MDS, d'orchestration et de contrôle d'accès offrent un moyen de renforcer la sécurité des données à mesure que le volume continue de croître. C’est une approche adaptée à un présent et un futur centrés sur les données.
PUBLICATIONS INTÉRESSANTES


Paul Speciale est un vétéran de l'industrie du cloud et du stockage de données avec plus de 20 ans d'expérience dans les petites et grandes entreprises. Paul est actuellement évangéliste technologique en chef et directeur marketing de Scality, dirigeant l'équipe dans des activités allant de la sensibilisation au développement de contenu et à la génération de leads, ainsi qu'en tant que porte-parole de l'entreprise.