8 façons de préparer votre centre de données pour l’IA puissance du tirage

0
5

Que l’intelligence artificielle prend son envol dans l’entreprise des paramètres, il en sera de centre de données, l’utilisation de l’énergie. L’IA est beaucoup de choses, mais efficace de l’énergie n’est pas l’un d’eux.

Pour les centres de données de course typiques d’applications d’entreprise, la consommation moyenne d’énergie pour un rack est autour de 7 kW. Pourtant, il est commun pour les IA des applications pour l’utilisation de plus de 30 kW par rack, selon le centre de données de l’organisation AFCOM. C’est parce que l’IA exige beaucoup plus de l’utilisation du processeur, et les processeurs – surtout Gpu – sont avides de pouvoir. Nvidia Gpu, par exemple, peut fonctionner plusieurs ordres de grandeur plus rapide qu’un PROCESSEUR, mais aussi qu’ils consomment deux fois plus de puissance par puce. Pour compliquer le problème, c’est que de nombreux centres de données sont déjà pouvoir de contrainte.

LIRE la suite: avez-vous vraiment besoin de calcul haute performance?

Le refroidissement est aussi une question: AI-orienté serveurs nécessitent une plus grande processeur densité, ce qui signifie plus de jetons entassés dans la boîte, et ils sont tous très chaud. Une plus grande densité, avec l’accroissement de l’utilisation, de la hausse de la demande de refroidissement par rapport à un type de back-office de serveur. Hausse des exigences en matière de refroidissement, à son tour augmenter la puissance de demandes.

Alors, que pouvez-vous faire si vous souhaitez adopter l’IA pour des raisons de concurrence, mais la capacité de la puissance de votre installation existante n’est pas jusqu’à la haute densité des besoins en infrastructure de l’IA? Voici quelques options.

Envisager de liquide de refroidissement

Ventilateur de refroidissement généralement perd sa viabilité une fois une étagère supérieure à 15 kW. De l’eau, cependant, a 3 000 fois la capacité calorifique de l’air, selon CoolIT Systems, un fabricant d’entreprise de liquide de refroidissement des produits. En conséquence, armoire de serveur décideurs ont été l’ajout de conduites de liquides de leurs cabinets et de raccordement de la tuyauterie d’eau à leurs dissipateurs de chaleur au lieu de fans.

“Liquide de refroidissement est certainement une très bonne option pour une densité plus élevée des charges”, explique Jean-Sasser, senior vice-président pour les opérations des centres de données à Sabey, un développeur et exploitant de centres de données. “Qui supprime le désordre problème de la circulation de l’air. L’eau enlève beaucoup plus de chaleur que l’air n’, et vous pouvez le diriger à travers les tuyaux. Beaucoup de HPC [calcul haute performance] est fait avec du liquide de refroidissement.”

La plupart des centres de données sont mis en place pour l’air de refroidissement, de sorte que le liquide de refroidissement va nécessiter un investissement en capital, “mais ce pourrait être un beaucoup plus sage solution pour ces efforts, en particulier si une entreprise décide de se déplacer dans la direction de [IA],” Sasser dit.

Exécuter AI des charges de travail dans les basses résolutions

Les datacenters existants pourraient être en mesure de gérer l’IA de calcul des charges de travail, mais à une réduction de la mode, dit Steve Conway, senior vice-présidente de recherche pour Hyperion de Recherche. Beaucoup, sinon la plupart, des charges de travail peuvent être exploités à la moitié ou le quart de précision plutôt que 64 bits double précision.

“Pour certains problèmes, la moitié de précision est très bien,” Conway dit. “L’exécuter à résolution plus faible, avec moins de données. Ou avec moins de science en elle.”

Double-précision des calculs en virgule flottante sont surtout nécessaires dans la recherche scientifique, ce qui est souvent faite au niveau moléculaire. Double précision n’est généralement pas utilisée dans IA formation ou de l’inférence sur l’apprentissage en profondeur des modèles, car il n’est pas nécessaire. Même Nvidia préconise l’utilisation d’une seule et demi-calculs de précision dans la profondeur des réseaux de neurones.

Construire une IA de confinement segment

L’IA va être une partie de votre entreprise, mais pas tous, et qui devrait être reflété dans votre centre de données. “Les nouvelles installations en cours de construction envisagent d’allouer une partie de leurs installations à la hausse de l’utilisation de l’énergie”, a dit Doug Hollidge, un partenaire avec Cinq 9s Numérique, qui construit et exploite des centres de données. “Vous n’allez pas à mettre toutes vos installations de densité plus élevée, car il ya d’autres applications à faible tirage.”

La première chose à faire est d’évaluer l’approvisionnement énergétique pour le bâtiment, Hollidge dit. “Si vous allez augmenter l’utilisation de l’énergie dans le bâtiment, vous devez assurez-vous que le fournisseur d’énergie peut augmenter la puissance d’alimentation.”

Apporter un ingénieur d’évaluer dans quelle partie du centre de données est le mieux équipé pour une densité plus élevée des capacités. Charge de travail permettra de déterminer la meilleure solution, que ce soit chaud confinement de l’allée ou de liquide de refroidissement ou une autre technologie. “Il est difficile de donner des one-size-fits-all solution car tous les centres de données sont différentes,” Hollidge dit.

Étendez votre système d’intelligence artificielle

Une approche alternative plutôt que de surpeuplement tous de votre système d’intelligence artificielle dans un endroit plus chaud que la Vallée de la Mort en août – est à répartir entre les racks.

“La plupart des applications ne sont pas de haute densité. Ils s’exécutent à huit à 10 kilowatts et jusqu’à 15 kilowatts. Vous pouvez gérer tout cela avec de l’air,” dit David McCall, directeur de l’innovation avec QTS, un constructeur de centres de données.

L’optimisation de la environnement hétérogène, une collocation fournisseur peut avoir un rack ou deux dans un cabinet pour l’accueil d’un CPS ou de l’IA de l’environnement, et le reste des étagères dans l’armoire sont dédiés à l’hébergement de moins avide de pouvoir les applications comme les bases de données et de back-office applications. Qui ne cèdent pas à 5 kW rack, mais il devient un rack de près de 12 kW, 15 kW, ce qui est un environnement que l’air de refroidissement peut gérer, McCall dit.

Contrôle le flux d’air chaud dans le centre de données

Standard centre de données, mise en page est allée chaude/allée froide, où les armoires sont disposées en lignes alternées, de sorte que les entrées d’air froid en face de l’autre sur une face de l’allée, et l’air chaud d’échappement en face de l’autre sur l’alternance en arrière-face de l’allée. Cela fonctionne bien, mais l’accès peut être difficile si un travailleur a besoin pour passer derrière un cabinet de travail sur un serveur.

L’autre problème est que l’air est “bordélique”, comme Sasser mettre. L’alimentation est souvent plus facile de modèle, car il coule à travers les conducteurs, et vous pouvez contrôler (et donc le plan et le modèle) où le pouvoir va. L’Air va où il veut et est difficile à contrôler.

Sabey les clients qui veulent plus grande densité des environnements utiliser un confinement de l’allée chaude pod de contrôle de flux d’air. L’entreprise met de portes à la fin de l’allée chaude et assiettes en plastique sur le dessus, de sorte que la chaleur est dirigé dans un plafond pipe d’admission et les obstacles à garder l’air chaud et l’air froid à partir d’un mélange.

“Dans un à refroidissement par air de serveur de monde, je le conseille, c’est d’aller avec un confinement de l’allée chaude de l’environnement,” Sasser dit. “L’autre conseil que je donnerais est de s’assurer que le centre de données est testée pour le flux d’air, et pas seulement modélisés pour la circulation de l’air. La modélisation dépend de beaucoup de variables, et ils changent facilement.”

Envisager une cheminée du cabinet

Une autre façon d’aider à gérer les températures dans les centres de données est d’utiliser une cheminée du cabinet. Au lieu d’évacuer l’air chaud à l’arrière, d’une cheminée du cabinet utilise la bonne vieille physique de la convection pour envoyer de l’air chaud vers le haut dans une cheminée, qui est ensuite connecté à un système de climatisation à l’évent. Chatsworth Systèmes est le plus connu pour ce style de meubles.

“L’air de la voie est plus restreint de cette façon,” Sasser dit. “Depuis que de l’air de la voie est plus limité, vous pouvez obtenir une plus grande densité dans un cabinet qu’avec une allée chaude pod.”

Les données de processus où il réside

Déplacer les données a une très forte du coût de l’énergie: Il peut prendre jusqu’à 100 fois plus d’énergie pour déplacer des données qu’il n’en faut pour traiter les données, Conway dit. Toute forme de mouvement de données nécessite de l’électricité, et que la consommation électrique augmente avec le volume de données – un enjeu important pour de forte intensité de données et applications de l’IA. “Vous souhaitez déplacer des données que rarement et que peu de distance que vous le pouvez,” Conway dit.

“La solution est de ne pas avoir à déplacer les données plus ou de plus loin que ce qui est absolument nécessaire. Donc, les gens s’efforcent de mettre les données de plus près à l’endroit où elle est traitée. Une chose fournisseurs de services cloud et les personnes qui utilisent des services cloud d’accord sur le fait qu’il n’est pas judicieux de déplacer une quantité massive de données à un tiers cloud”, dit-il.

Envisager la location d’espace de centre de données

La plupart des entreprises qui cherchent à mettre en œuvre l’IA sont des sociétés qui louent des centre de données de l’espace à partir d’un centre de données de l’opérateur, Hollidge dit. Il y a quelques opérateurs de centres de données qui ne sont pas capable de gérer une haute densité de IA calcul, mais certains ont fait la transition à offrir une partie des environnements à haute densité pour les IA.

“Vous pourriez avoir à passer par un peu de prestataires avant de le trouver, mais il n’y a plus d’attention pour que, sur le fonctionnement des centres de données secondaires,” Hollidge dit. Et un tiers centre de données fournisseur vous donne plus d’options de croissance. “La plupart du temps, vous êtes mieux d’entrer dans un flexible de location qui vous permet de développer et faire croître votre IA entreprise, par opposition à la construction de base.”

Attendre la prochaine génération de serveurs

Les supercalculateurs à ce jour n’ont pas été très de données conviviale, Conway dit. Alors que les superordinateurs ont obtenu plus grand, les modèles ont obtenu moins centrée sur les données. Le résultat est que plus de données doit être déplacé autour de et la navette entre les processeurs, la mémoire et les systèmes de stockage. Et comme discuté ci-dessus, il en coûte plus de puissance pour déplacer des données que de la traiter.

La première exascale systèmes viendra avec d’autres accélérateurs et plus puissant interconnexions pour se déplacer de données. Et de nombreuses innovations qui débutent en calcul intensif, y compris les Gpu et de stockage de classe de la mémoire (SCM), éventuellement à travailler leur chemin vers le bas pour plus de serveurs grand public.

Futur en outre, les serveurs viennent avec un plus hétérogène puce de mise en page; au lieu de tous les Processeurs x86, ils comprennent Gpu, Fpga, et l’IA des accélérateurs. Et pour la grande vitesse de stockage, NVMe-sur-Tissu et SCM deviendra de plus en plus abordable. Les serveurs sont mis à changer dans les années à venir, et bon nombre de progrès bénéficieront d’entreprise de l’IA des environnements d’application.

En savoir plus sur le HPC et des superordinateurs

  • HPE acheter Cray, offre HPC en tant que service
  • Le déclassement le supercalculateur Titan
  • 10 des plus rapides du monde des supercalculateurs
  • Ce qui est de l’informatique quantique et pourquoi les entreprises de soins?
  • Qui du développement des ordinateurs quantiques?

Cette histoire, “8 façons de préparer votre centre de données pour l’IA puissance de tirage” a été initialement publié par