Le Livre Blanc HDInsight & Visual Studio est publié 🙂
Nous l’avons corédigé avec Jérome Christ, Yazid Moussaoui et Damien Dorison.
GlobeCast est une société française (filiale de France Telecom) dont les activités sont la gestion et la livraison de contenus multimédias.
La distribution de films / pubs dans les cinémas génère énormément de log et aujourd’hui aucun outil ne leur permet de les analyser, en effet ces données sont à la fois volumineuses :
- leur stockage peut être coûteux en capacité de stockage
- Leur redescente vers la plateforme centrale peut être couteuse en bande passante
De plus ces données peuvent être compliquées à exploiter étant donné que leur format n’est pas linéaire (fichiers XML).
Le livre blanc s’appuie sur la mise en place d’un POC prenant en compte les critères suivants :
- Faible coût de stockage des données
- Sécurisation des données stockées (elles comportent une certaine par de confidentialités, nous verrons en détail pourquoi)
- Capacité à traiter des données non structurées
- Capacité à traiter des données très volumineuses
- Capacité à fournir d’une manière simple et sécurisée dans rapports aux propriétaires des données
- Intégration simple dans la solution existante
Ces derniers points sont importants pour plusieurs raisons :
- GlobeCast dispose déjà d’un environnement de développement Microsoft (Windows Server, SQL Server), et ne souhaitait pas investir dans une nouvelle solution de Reporting
- Intuitivement, l’intégration d’une brique Microsoft dans l’environnement d’une solution Microsoft existante est plus simple que l’intégration d’une nouvelle technologie
- Les équipes de développement disposent déjà d’un environnement TFS et souhaitaient capitaliser sur cet environnement pour gérer le cycle de vie de ces nouveaux développements
- Enfin les développeurs étant équipés d’abonnement MSDN, il était souhaitable de pouvoir profiter des avantages apportés par ces licences dans le cadre de ces nouveaux développements
Voici le schéma de la solution technique mise en place :
Les données ont été distribuées sur une plateforme dite de BigData afin de profiter de la parallélisation massive des traitements, des possibilités d’analyse de données non structurées, d’enrichissement à l’aide des fonctions, etc…
Des rapports Power View permettent d’analyser les données rapatriées dans un cube tabulaire (Power Pivot)…
N’hésitez pas à nous faire un retour, bonne lecture
Un marché intéressant, en effet les bases ne sont pas à construire.
Projet intéressant de bout en bout, bien expliqué.
Par ailleurs, peut-être une coquille se serait glissée chapitre « 2.4.2 Cinée Box ». Dans la phrase « Le socle de la CineBoost est Windows 7 Embedded, … » : ne serait-ce pas « Cinebox » plutôt que cineboost puisque dans le chapitre précédent était dit que Cineboost était sous Linux ?
Merci et en effet c’est bien une erreur 😉