ARM annonce le GPU Mali-G77 avec la nouvelle architecture de GPU «Valhall» et des améliorations de performances 1.4x

ARM a annoncé le GPU Mali-G77 aux côtés du processeur Cortex-A77 lors de son TechDay annuel. Alors que le Cortex-A77 représente un progrès générationnel significatif par rapport à son prédécesseur, le Cortex-A76, le GPU Mali-G77 est totalement différent. Il s'agit du premier GPU de la gamme ARM au Mali à proposer une nouvelle architecture de GPU depuis le Mali-G71, qui a introduit l'architecture Bifrost en 2016. Le Mali-G77 apporte la toute nouvelle architecture «Valhall».

Bien que l'IP du processeur ARM soit historiquement assez compétitive dans le paysage plus large des smartphones, la gamme de processeurs graphiques de la société au Mali a eu du mal à concurrencer les meilleures solutions au fil des ans. À maintes reprises, les GPU de la série Mali se sont révélés inférieurs aux GPU PowerVR d'Adreno et d'Imagination Technologies en termes de performances et d'efficacité énergétique. L'architecture Bifrost a succédé à l'architecture Midgard, passant d'un type vectoriel à un type scalaire. Malheureusement, cela ne nous a pas permis de combler l'écart de performances et d'efficacité énergétique apparemment grandissant. Les modèles Mali-G71 et Mali-G72 ont subi une consommation d'énergie excessivement élevée et un étranglement qui les a rendus inférieurs aux GPU Adreno de Qualcomm et au GPU personnalisé d'Apple (à commencer par le Apple A11).

Les performances médiocres du processeur graphique sont devenues un problème si important que les éditeurs ont envisagé de faibles gains de GPU après une génération. Le GPU Mali-G72MP18 d'Exynos 9810 constituait une légère amélioration par rapport à son prédécesseur, par exemple. Le groupe HiSilicon de Huawei a eu beaucoup plus de difficultés avec les GPU du Mali. HiSilicon Kirin 960 et Kirin 970 ont été abandonnés par des GPU consommant une puissance anormalement élevée tout en offrant des performances relativement moindres, dans la mesure où Huawei a été contraint d'introduire un mécanisme de limitation non conventionnel, ce qui a conduit à la découverte de tricheries de référence pour plusieurs téléphones Huawei. l'année dernière.

Le Mali-G76 de l'année dernière a heureusement apporté des améliorations substantielles sur le plan des performances et de l'efficacité énergétique. En utilisant une version 10 cœurs du Mali-G76, HiSilicon a été en mesure de promettre des améliorations de performances de 46%. Même si la société a atteint les chiffres de performances, elle n’a toujours pas réussi à prendre les performances du GPU (performances maximales et durables). ainsi que la couronne d'efficacité énergétique. Samsung Systems LSI a implémenté une version à 12 cœurs du processeur graphique dans l'Exynos 9820 et a fini par réduire l'écart entre le processeur graphique Adreno 640 de Qualcomm Snapdragon 855. Les GPU Adreno de Qualcomm sont restés les leaders de la classe sur le marché Android, mais Apple a fait encore mieux l'année dernière avec le GPU personnalisé de l'Apple A12. Apple a réussi à battre Qualcomm à la fois en termes de performances maximales et durables, et la société a également présenté une efficacité énergétique compétitive. Actuellement, le processeur graphique de l'A12 reste le leader, tandis que le processeur graphique Adreno 640 du Snapdragon 855 est classé deuxième sur la plupart des benchmarks.

Face à cet environnement concurrentiel, ARM devait relever le défi.

Le résultat en fut le Mali-G77 et la nouvelle architecture de Valhall. ARM indique qu’il offre une augmentation de 30% de la densité de performances, 30% d’améliorations de l’efficacité énergétique et 60% d’amélioration de l’apprentissage automatique (ML). ARM s'attend à ce que le Mali-G77 fournisse des performances graphiques maximales de 40% supérieures sur les appareils mobiles.

La société s'attend à ce que le Mali-G77 apporte davantage de jeux haut de gamme aux téléphones mobiles, et note que 2018 était l'année où les revenus provenant des jeux mobiles dépassaient pour la première fois les revenus générés par les jeux sur console et sur PC.

En ce qui concerne la ML, ARM indique que le Mali-G77 offre aux appareils les capacités nécessaires pour effectuer plus rapidement des tâches de ML de plus en plus complexes, avec une amélioration de la densité de performance de 60%. Cela vaut mieux que de les envoyer dans le cloud pour traitement, ce qui entraîne davantage de problèmes de sécurité, une baisse des performances et une latence accrue.

La nouvelle architecture de Valhall constitue la base des GPU Mali-G77 et futurs du Mali. Selon ARM, les caractéristiques suivantes de Valhall en font une «architecture nouvelle»:

  • «Un nouveau moteur superscalaire, qui offre un nouveau bond en matière d'efficacité énergétique et de densité de performance
  • Un ISA scalaire simplifié avec un nouveau jeu d'instructions plus convivial pour le compilateur
  • Nouvelle programmation dynamique des instructions
  • Les infrastructures de données retravaillées sont mieux alignées sur les API modernes, telles que Vulkan.
  • Bien qu'il existe de nombreuses avancées et de nouvelles fonctionnalités, les deux principales sont le moteur d'exécution et le mappeur de texture de Mali-G77. ”

Les moteurs à large exécution du Mali-G77 améliorent la densité de performance en partageant le contrôle sur un grand nombre de voies, selon ARM. Le Mali-G76 a 8 chaînes larges et un total de 24 voies FMA par noyau de shader, tandis que le Mali-G77 possède 16 chaînes larges, 32 voies (deux groupes de 16 FMA par moteur d'exécution) et un moteur par noyau de shader. Cela se traduit par 33% de calculs en plus dans la même zone par rapport au G76, selon la société.

ARM indique également que les performances de jeu améliorées du Mali-G77 sont liées au mappeur de texture quad, qui fournit quatre texels / cycle, soit un débit 2x supérieur à celui du Mali-G76 et 4x supérieur au G72. Il a été dit que cela apporterait des améliorations dans les jeux haute fidélité et occasionnels, mais cela aura un impact particulièrement important sur les jeux à texture épaisse. La capacité de calcul du G77 a été augmentée, de sorte que la capacité de texture devait également être augmentée pour maintenir l'équilibre de la machine, selon ARM. Le but final? Offrez plus de performances par millimètre carré qu'auparavant.

Le Mali-G77 a été optimisé pour s’adapter aux nouveaux moteurs d’exécution d’une largeur de 16 pouces et au mappeur de texture quad. Cette optimisation comprend une refonte du canal LSC et du canal attributaire en mettant l’accent sur la densité de performances et l’efficacité énergétique.

ARM dit qu’il a un «objectif important» d’améliorer l’efficacité énergétique et fait valoir que le Mali-G77 peut effectuer le même travail sur 50% de l’énergie du Mali-G72 depuis deux ans. Selon la société, l'architecture Valhall et le Mali-G77 améliorent l'efficacité énergétique sur toutes les charges de travail, entraînant une amélioration de 1, 3 fois sur «une large gamme de contenu», ce qui signifie que les utilisateurs disposeront d'une plus longue durée de vie de la batterie sur les appareils haut de gamme.

ARM indique que la planification dynamique des instructions est désormais gérée dans le matériel afin d'améliorer les performances. On dit que l’ordonnanceur dynamique décide des instructions à exécuter à partir de quels warps, puis le travail est envoyé à des ALU parallèles indépendantes dans un style superscalaire.

Enfin, ARM note que l’architecture Valhall poursuit l’évolution de la compression du tampon de trame ARM jusqu’à AFBC 1.3. Il apporte de nouvelles fonctionnalités qui peuvent être lues dans le blog d’ARM.

ARM a de grandes promesses pour le Mali-G77, proclamant qu'il apportera des améliorations significatives de la performance dans les RA et ML complexes, et fournira «des performances graphiques sans compromis et une efficacité accrue». Si les revendications se concrétisent, nous pourrions enfin voir un GPU d'ARM Mali en affrontant, voire en améliorant, le processeur graphique Adreno d'une génération donnée, le marché des processeurs graphiques mobiles devient de plus en plus concurrentiel.

Source : ARM

Via : AnandTech