ClouderaNOW24     Voir les dernières innovations de Cloudera

Regarder dès maintenant
  • Cloudera Cloudera
  • Vue d'ensemble

    Déployez rapidement et facilement un vaste éventail d'analyses dans le cloud public.

    CDP Data Hub est un service performant d'analyse sur le cloud public de Cloudera Data Platform (CDP) qui permet d'obtenir plus facilement et rapidement des analyses avancées de l'Edge à l'IA dans un modèle de cluster familier dans le cloud. Grâce à la plus large gamme d'analyses des charges de travail, dont le streaming, l'ETL, les datamarts, les bases de données et le machine learning, CDP Data Hub vous permet de déplacer les charges de travail sur site vers le cloud ou de les intégrer directement au cloud en toute simplicité.

    Cette solution complète et basée cloud est optimisée par Cloudera Runtime, une suite de technologies open source, et intégrée à SDX. Elle propose un grand choix de formes de clusters, de types de charges de travail, de modèles prédéfinis et d'options de configuration afin d'offrir une expérience intuitive et personnalisable aux utilisateurs qui sont à l'aise avec les architectures traditionnelles.

    Cas d'utilisation de Data Hub

    Simplifiez votre parcours vers le cloud

    Déployez et faites évoluer les charges de travail Cloudera sur site vers le cloud public en toute simplicité grâce à une plateforme qui couvre les clouds publics comme privés et qui permet :

    • Des performances améliorées, une gouvernance solide et une disponibilité du cloud public
    • Une flexibilité pour l'optimisation de vos charges de travail dans les deux modèles de déploiement
    • Une transition plus facile vers le cloud grâce aux avantages d'un facteur d'encombrement familier et d'un modèle de cluster traditionnel
    • Un scénario de migration fluide vers les expériences conteneurisées de CDP
    Déployez rapidement des charges de travail multi-analyses complexes

    Accélérez le déploiement de charges de travail complexes dans le cloud public tout au long du cycle de vie des données grâce à : 

    • Une architecture basée cloud qui vous permet de déployer une large gamme de charges de travail d'analyse personnalisées et flexibles
    • Une expérience intuitive à l'aide de clusters familiers basés sur les nœuds, que vous choisissiez une approche modélisée ou que vous créiez vos propres charges de travail
    • Un haut niveau de personnalisation qui vous permet de déployer des charges de travail sur mesure pour répondre aux besoins particuliers de votre entreprise

    Sélectionner des charges de travail

    • Datamart en temps réel
    • Ingénierie de données pour les pipelines complexes
    • Streaming sur cloud hybride
    • Base de données opérationnelle

    Datamart en temps réel


    Permettre l'analyse de grands volumes de données arrivant rapidement.

    Le modèle de datamart en temps réel dans Data Hub vous permet d'ingérer des millions de dossiers par seconde, avec des mises à jour en place selon vos besoins. Les données sont disponibles immédiatement dans un format optimal pour les requêtes. Ce modèle est idéal pour les applications de série chronologique, les analyses d'événements, le rapprochement CDC et les pipelines de traitement des données en temps réel. Il comprend le moteur de stockage d'analyse Apache Kudu, Apache Impala pour une exécution SQL rapide, Hue pour le développement et l'analyse SQL et Apache Spark Streaming pour le traitement et l'analyse de flux.

     

    Ingénierie de données pour les pipelines complexes


    Enrichir, transformer et charger des données. 

    Data Hub vous permet d'enrichir, de transformer et de nettoyer des données afin de créer, d'exécuter et de gérer des pipelines de données de bout en bout à un degré élevé de flexibilité et de personnalisation. Le modèle d'ingénierie de données vous permet d'exécuter une large gamme de charges de travail de traitement de données, y compris le traitement par lots et de flux en temps réel, à l'aide d'Apache Spark et de Hive.

    Streaming sur cloud hybride



    Collecter, traiter et créer des analyses en temps réel

    DataFlow pour CDP Data Hub est une plateforme complète de données en flux de la périphérie du réseau au cloud qui répond à certains des défis posés par les données en flux dans les environnements hybrides, avec Apache NiFi et Kafka. Il permet aux utilisateurs de prolonger leurs flux sur site de Cloudera DataFlow sur le cloud, sans nécessiter d'énormes ressources pour les développer, les configurer et les maintenir.

    En savoir plus sur les services cloud DataFlow

    Base de données opérationnelle


    Créez des applications de niveau professionnel extrêmement fiables. 

    Data Hub vous permet de faire fonctionner des bases de données NoSQL de haute performance, prenant en charge ANSI SQL. Il favorise une évolutivité et une performance incomparables pour les applications opérationnelles stratégiques avec Apache Hbase. Operational Database prend en charge un schéma évolutif qui permet aux développeurs de bénéficier de la puissance des données, tout en préservant la flexibilité dans la conception de l'application. Elle fournit également une adaptation automatique basée sur l'utilisation de la charge de travail du cluster pour optimiser l'utilisation et le coût de l'infrastructure.

    Fonctionnalités

    Data Hub s'adresse aux utilisateurs qui recherchent de la flexibilité, de l'évolutivité et une simplicité d'utilisation. Il vous permet de réorganiser les rôles des employés, de configurer la prise en charge du GPU, de régler les paramètres de gestion des ressources et d'adapter les clusters afin d'exécuter des cas d'utilisation d'analyse complexes et multifonctions à l'échelle.

    Les clusters Data Hub peuvent être rapidement mis à disposition et éliminés grâce à des options de configuration de l'infrastructure pré-conçues ou personnalisées. Les définitions des clusters pré-configurés avec des paramètres spécifiques au fournisseur de cloud et les modèles de cluster élaborés avec les services de configuration de Cloudera Runtime vous permettent de mettre à disposition rapidement des clusters de charge de travail pour des cas d'utilisation à la demande. Vous pouvez également enregistrer vos propres définitions et modèles de clusters pour une réutilisation ultérieure.

    Data Hub vous permet de déplacer facilement vos charges de travail héritées dans un facteur d'encombrement familier vers un modèle de cloud. L'architecture basée cloud sépare les données de l'infrastructure de calcul, et la couche de transmission des données est extraite des données brutes. Cette architecture séparée améliore sensiblement la flexibilité, l'agilité, la protection des données et l'évolutivité.

    Il est simple de mettre à disposition plusieurs clusters avec des données partagées, de sorte que les clients puissent lancer de nouvelles applications complètement isolées s'ils le souhaitent, avec la sécurité et la gouvernance adéquates, et ce sans risquer d'interrompre les applications de production en cours.

    Data Hub repose sur Cloudera SDX, ce qui vous permet de sécuriser et de réguler les données et les métadonnées de la plateforme, et de bénéficier de capacités et d'interfaces intégrées et contrôlées pour les gérer. Les politiques de sécurité, de gouvernance et de contrôle des données ne doivent être définies qu’une seule fois et seront systématiquement appliquées de partout. Vous réduirez ainsi les coûts opérationnels et les risques pour votre entreprise, tout en offrant un choix et une flexibilité de déploiement ultimes.

    Data Hub est intégré à Cloudera Runtime, la distribution logicielle open source principale avec CDP qui comprend environ 50 projets open source. L'exploitation de Runtime vous permet de tirer parti du bon ensemble d'outils open source pour créer vos charges de travail et vos applications.

    Vous souhaitez approfondir le sujet ?


    Faites un essai de Data Hub sur Cloudera Data Platform

    Datasheet

    Cloudsmart : commencer son parcours d'analyse dans le cloud

    Webinar

    Effectuer des analyses en toute confiance dans le cloud public

    Ebook

    Réussir sa migration vers le cloud public en 3 étapes

    Solution Brief

    Comment obtenir de meilleurs résultats de santé grâce à Cloudera et à IQVIA

    Formation, assistance et services haut de gamme

    Your form submission has failed.

    This may have been caused by one of the following:

    • Your request timed out
    • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.