Your browser is out of date

Update your browser to view this website correctly. Update my browser now

×

Vue d'ensemble

Stockez, traitez et analysez des données structurées et non structurées au repos en toute sécurité 

Hortonworks Data Platform (HDP) est un framework open source destiné au stockage et au traitement distribués d'ensembles de données volumineux et multi-sources. HDP modernise votre infrastructure informatique et assure la sécurité de vos données dans le cloud ou sur site tout en vous permettant de créer de nouvelles sources de revenus, d'améliorer l'expérience client et de réduire vos frais. 

HDP offre un déploiement flexible d'applications, des charges de travail de machine learning et de deep learning, un entreposage des données en temps réel, ainsi que des capacités de sécurité et de gouvernance des données. Il s'agit d'une composante clé pour mettre en place une architecture de données au repos moderne.

 

Pourquoi choisir HDP ?

La dernière version de HDP offre de nouvelles fonctionnalités destinées aux entreprises : déploiement flexible d'applications, nouvelles charges de travail de machine learning et de deep learning, entreposage des données en temps réel, ainsi que des capacités de sécurité et de gouvernance des données. Il s'agit d'une composante clé pour mettre en place une architecture de données moderne.

HDP Diagram

Avantages et fonctionnalités clés

Un service reposant sur des containers de données permet de créer et d'exécuter des applications en quelques minutes. La containérisation offre la possibilité d'exécuter plusieurs versions d'une même application afin de créer rapidement de nouvelles fonctionnalités et de développer et tester de nouvelles versions sans perturber les anciennes. HDP prend également en charge des applications tierces dans des containers Docker et YARN natifs. L'Erasure coding améliore de 50 % l'efficacité du stockage. Cette réplication efficace des données permet de diminuer le coût total de possession.

HDP permet de prendre en charge des processeurs graphiques dans des clusters Hadoop Apache et améliore ainsi la performance des calculs requis dans des cas d'utilisation liés à la data science et l'intelligence artificielle. Le pooling du processeur graphique permet de partager ses ressources avec un plus grand nombre de charges de travail afin de réduire les coûts. La solution se charge également du partitionnement du processeur graphique en consacrant un processeur graphique à une application, de sorte qu'aucune autre application n'ait accès à ce processeur graphique.

HDP inclut une version tech preview avec conteneurs de TensorFlow qui, associée au pooling du processeur graphique, facilite la conception, la réalisation et la formation de modèles de deep learning.

Avec HDP, vous pouvez déployer des charges de travail du big data dans des environnements hybrides et multi-cloud sans subir de dépendance commerciale vous limitant à une architecture cloud particulière. Les clients peuvent créer et gérer des clusters big data en toute facilité et dans n'importe quelle configuration cloud. Indépendant de tout fournisseur de services cloud, HDP offre un approvisionnement automatique permettant de simplifier les déploiements big data tout en optimisant l'utilisation des ressources du cloud.

Prise en charge du stockage dans le cloud pour stocker un nombre illimité de données dans leur format natif, notamment Microsoft ADLS, WASB, AWS S3 et Google Cloud Storage. Cloudbreak permet de provisionner facilement des clusters dans le cloud en déployant HDP vers le fournisseur de services cloud de votre choix

HDP offre des performances améliorées en matière de traitement des requêtes. Hive LLAP, le moteur Apache Hive le plus rapide, s'exécute dans un environnement multi-tenant sans placer les ressources en concurrence. Cette intégration accélère considérablement les requêtes habituellement utilisées en business intelligence, comme les requêtes de jointure ou d'agrégation. En outre, Apache Hive permet également de créer des pools de ressources pour une répartition plus précise.

HDP permet d'effectuer des transactions aux propriétés ACID par défaut, simplifiant ainsi les mises à jour dans les tableaux de Hive et la mise en conformité avec les exigences du RGPD. La base de données en temps réel Hive aligne les performances entre les charges de travail à faible latence et à haut débit afin de traiter une plus grande quantité de données plus rapidement.

HDP continue d'assurer une sécurité et une gouvernance complètes des données. La sécurité de HDP est intégrée à plusieurs niveaux et inclut des fonctionnalités d'authentification, d'autorisation, de responsabilité et de protection des données. L'intégration de la sécurité et de la gouvernance permet aux professionnels de la sécurité d'établir des politiques fondées sur la classification. En outre, les outils de gouvernance des données aident les entreprises à appliquer une classification des données cohérente sur l'ensemble de leur écosystème.

Des fonctionnalités supplémentaires permettent de vérifier des événements afin de gagner en précision et simplifier le travail des auditeurs. Les auditeurs et les utilisateurs peuvent consulter toute la chaîne de surveillance au fur et à mesure que les données transitent dans l'écosystème. La propagation des balises leur permet également de savoir où sont transférées les données dans l'entreprise et de conserver le contexte des données sensibles. Les politiques axées sur le temps d'utilisation permettent d'attribuer un accès temporaire à un utilisateur donné.

Data Hub facilite la gestion, la surveillance et l'orchestration de tous les services à partir d'un seul et même tableau de bord pour tous les environnements.

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.