Cours 01 - CAQA5e_ch1
description
Transcript of Cours 01 - CAQA5e_ch1
![Page 1: Cours 01 - CAQA5e_ch1](https://reader031.fdocuments.us/reader031/viewer/2022020506/56d6bf1e1a28ab301694f350/html5/thumbnails/1.jpg)
The University of Adelaide, School of Computer Science 30 avril 2014
Chapter 2 — Instructions: Language of the Computer 1
1 Copyright © 2012, Elsevier Inc. All rights reserved.
Chapitre 1
Historique et éléments de base pour une analyse quantitative.
Computer Architecture A Quantitative Approach, Fifth Edition
2
Plan de la présentation
n Historique n Progression technologique
n Tendances actuelles n Enjeux actuels
n Dissipation de la puissance n Consommation d’énergie
Copyright © 2012, Elsevier Inc. All rights reserved.
![Page 2: Cours 01 - CAQA5e_ch1](https://reader031.fdocuments.us/reader031/viewer/2022020506/56d6bf1e1a28ab301694f350/html5/thumbnails/2.jpg)
The University of Adelaide, School of Computer Science 30 avril 2014
Chapter 2 — Instructions: Language of the Computer 2
3 Copyright © 2012, Elsevier Inc. All rights reserved.
Technologies des systèmes ordinés
n Amélioration de la performance: n Au niveau des semiconducteurs
n Vitesse d’horloge, grandeur du transistor n Au niveau de l’architecture
n Architectures RISC n Pipeline, “scheduling” dynamique , VLIW,
superscalaires n Processeurs multicoeurs
n Résultats obtenus: n Ordinateurs légers, rapides, autonomes n Une gestion basée sur la productivité
4 Copyright © 2012, Elsevier Inc. All rights reserved.
Performance des processeurs
RISC
Apparition du multiprocesseur
![Page 3: Cours 01 - CAQA5e_ch1](https://reader031.fdocuments.us/reader031/viewer/2022020506/56d6bf1e1a28ab301694f350/html5/thumbnails/3.jpg)
The University of Adelaide, School of Computer Science 30 avril 2014
Chapter 2 — Instructions: Language of the Computer 3
5 Copyright © 2012, Elsevier Inc. All rights reserved.
Tendances actuelles n Depuis 2003, il est difficile d’améliorer la
performance d’un processeur à coeur unique. n On a atteint une limite définie par la capacité du
processeur à dissiper sa propre chaleur! n Grande demande d’appareils portables (tablettes,
téléphones intelligents) n Nouveaux modèles explorés:
n Data-level parallelism (DLP) n Thread-level parallelism (TLP) n Request-level parallelism (RLP)
n Ces nouvelles tendances requièrent que les applications soient restructurées.
6 Copyright © 2012, Elsevier Inc. All rights reserved.
Classes d’ordinateurs n Personal Mobile Device (PMD)
n Téléphones intelligents, tablettes n Enjeux: efficience énergétique, réponse en temps réel.
n Ordinateur de bureau n Enjeux: prix vs performance
n Serveurs n Enjeux: disponibilité, capacité de traitement, “scalability”.
n “Clusters / Warehouse Scale Computers” n Utilisés pour “Software as a Service (SaaS)” n Enjeux: disponibilité, prix vs performance
n Systèmes embarqués n Enjeux: le prix
![Page 4: Cours 01 - CAQA5e_ch1](https://reader031.fdocuments.us/reader031/viewer/2022020506/56d6bf1e1a28ab301694f350/html5/thumbnails/4.jpg)
The University of Adelaide, School of Computer Science 30 avril 2014
Chapter 2 — Instructions: Language of the Computer 4
7 Copyright © 2012, Elsevier Inc. All rights reserved.
Parallélisme n Afin d’accélérer le traitement de l’information,
plusieurs stratégies de parallélisme sont utilisées. n Instruction-Level Parallelism (ILP) n Vector architectures/Graphic Processor Units (GPUs) n Thread-Level Parallelism n Request-Level Parallelism
8 Copyright © 2012, Elsevier Inc. All rights reserved.
Taxonomie de Flynn n Single instruction stream, single data stream (SISD)
n Single instruction stream, multiple data streams (SIMD) n Architectures vectorielles n Extensions Multimedia (ex. MMX, SSE) n Processeur graphique (GPU)
n Multiple instruction streams, single data stream (MISD) n Aucune implémentation commerciale
n Multiple instruction streams, multiple data streams (MIMD) n Multicoeurs
![Page 5: Cours 01 - CAQA5e_ch1](https://reader031.fdocuments.us/reader031/viewer/2022020506/56d6bf1e1a28ab301694f350/html5/thumbnails/5.jpg)
The University of Adelaide, School of Computer Science 30 avril 2014
Chapter 2 — Instructions: Language of the Computer 5
9 Copyright © 2012, Elsevier Inc. All rights reserved.
Tendances technologiques n Circuits intégrés
n Densité des transistors: 35%/année n Grandeur du masque: 10-20%/année n Intégration globale: 40-55%/année
n Capacité de la mémoire DRAM: 25-40%/année
n Capacité de la mémoire Flash: 50-60%/année n De 15 à 20 fois moins cher que le DRAM
n Disques magnétiques: 40%/année n De 15 à 25 fois moins cher que le Flash n De 300 à 500 fois moins cher que le DRAM
10 Copyright © 2012, Elsevier Inc. All rights reserved.
Bande passante et temps réponse
n Bande passante (“throughput”) n Somme de travail pouvant être réalisée par unité de
temps. n Processeurs: amélioration de 10,000 à 25,000 fois. n Mémoire et disques: amélioration de 300 à 1200 fois.
n Temps réponse (“Latency”) n Temps requis entre le début et la fin d’un événement. n Processeurs: amélioration de 30 à 80 fois n Mémoire et disques: amélioration de 6 à 8 fois
![Page 6: Cours 01 - CAQA5e_ch1](https://reader031.fdocuments.us/reader031/viewer/2022020506/56d6bf1e1a28ab301694f350/html5/thumbnails/6.jpg)
The University of Adelaide, School of Computer Science 30 avril 2014
Chapter 2 — Instructions: Language of the Computer 6
11 Copyright © 2012, Elsevier Inc. All rights reserved.
Bande passante et temps réponse
Log-log plot of bandwidth and latency milestones
12 Copyright © 2012, Elsevier Inc. All rights reserved.
Transistors et connexions n Grandeur des transistors sur le masque
n 10 microns en 1971 à .032 microns in 2011
n La performance s’améliore linéairement avec la grandeur du transistor
n Plus le transistor est petit, plus il réagit rapidement.
n La capacité d’intégration s’améliore de façon quadratique avec la grandeur du transistor.
n Plus le transistor est petit, moins il dissipe d’énergie.
![Page 7: Cours 01 - CAQA5e_ch1](https://reader031.fdocuments.us/reader031/viewer/2022020506/56d6bf1e1a28ab301694f350/html5/thumbnails/7.jpg)
The University of Adelaide, School of Computer Science 30 avril 2014
Chapter 2 — Instructions: Language of the Computer 7
13
Microarchitecture Intel Core
Copyright © 2012, Elsevier Inc. All rights reserved.
Référence: Wikipedia
14 Copyright © 2012, Elsevier Inc. All rights reserved.
Puissance n Intel 80386 ~ 2 W
n 3.3 GHz Intel Core i7 - 130 W
n La chaleur doit toujours être dissipée d’une puce de 1.5 x 1.5 cm
n 130W est la limite de ce qui peut être refroidi par de l’air
![Page 8: Cours 01 - CAQA5e_ch1](https://reader031.fdocuments.us/reader031/viewer/2022020506/56d6bf1e1a28ab301694f350/html5/thumbnails/8.jpg)
The University of Adelaide, School of Computer Science 30 avril 2014
Chapter 2 — Instructions: Language of the Computer 8
15 Copyright © 2012, Elsevier Inc. All rights reserved.
Énergie et puissance dynamiques
n Énergie dynamique n À toutes les fois qu’un transistor passe de 0 à 1 ou de
1 à 0 n ½ x Charge capacitive x Voltage2
n Puissance dynamique n ½ x Charge capacitive x Voltage2 x Fréquence
n Lorsqu’on réduit la fréquence de l’horloge, on réduit la puissance, pas l’énergie
16 Copyright © 2012, Elsevier Inc. All rights reserved.
Puissance statique n La puissance statique consommée:
n Courantstatic x Voltage n Varie avec le nombre de transistors
![Page 9: Cours 01 - CAQA5e_ch1](https://reader031.fdocuments.us/reader031/viewer/2022020506/56d6bf1e1a28ab301694f350/html5/thumbnails/9.jpg)
The University of Adelaide, School of Computer Science 30 avril 2014
Chapter 2 — Instructions: Language of the Computer 9
17
Exemple p.22 (energy consumption)
Le processeur A consomme 20% plus de puissance que le processeur B. Mais le processeur A peut exécuter le même code en 70% du temps que le ferait le processeur B. Quel processeur a la meilleure performance énergétique?
Copyright © 2012, Elsevier Inc. All rights reserved.
P: puissance consommée durant l’exécution d’une tâche T: temps d’exécution d’une tâche E: énergie PA = PB *1.2 TA = TB * 0.7 EA = PA * TA= (PB * 1.2) * (TB * 0.7) = PB * TB * 0.84 EB = PB * TB EA/EB = 0.84 è Le processeur A a la meilleure performance énergétique.
18
Exemple p.23 (energy & power)
Un processeur fonctionne avec une réduction de 15% de son voltage nominal et une réduction de 15% de sa fréquence nominale. Quel est l’impact sur l’énergie et la puissance dynamique consommées?
Copyright © 2012, Elsevier Inc. All rights reserved.
E’/E = V’2 / V2 E’/E = (V * 0.85)2 / V2 E’/E = 0.72 è On réalise une économie énergétique de (1 - 0.72) soit 28% P’/P = V’2 * Freq’ / V2 * Freq P’/P = V’2 / V2 * Freq’ / Freq P’/P = 0.72 * 0.85 P’/P = 0.61 è On réalise une économie de puissance de (1 – 0.61) soit 39%
![Page 10: Cours 01 - CAQA5e_ch1](https://reader031.fdocuments.us/reader031/viewer/2022020506/56d6bf1e1a28ab301694f350/html5/thumbnails/10.jpg)
The University of Adelaide, School of Computer Science 30 avril 2014
Chapter 2 — Instructions: Language of the Computer 10
19 Copyright © 2012, Elsevier Inc. All rights reserved.
Puissance et énergie n Le problème: comment dissiper la puissance n Un paramètre couramment utilisé est le “Thermal
Design Power” (TDP) n Le TDP caractérise la consommation continue en
puissance d’un “chip”. n Il est utilisé pour déterminer l’alimentation et le
système de refroidissement nécessaires. n Plus petit que la puissance maximum n Plus grand que la puissance moyenne
20 Copyright © 2012, Elsevier Inc. All rights reserved.
Puissance et énergie n La vitesse d’horloge peut être réduite
dynamiquement pour limiter la consommation de puissance.
n Les technologies émergentes stoppent certaines fonctions du chip pour réduire la puissance consommée.
n L’énergie par tâche est souvent une meilleure mesure (notamment pour les serveurs)
n La consommation d’énergie est importante pour les appareils portables (téléphones intelligents, tablettes, etc.)
![Page 11: Cours 01 - CAQA5e_ch1](https://reader031.fdocuments.us/reader031/viewer/2022020506/56d6bf1e1a28ab301694f350/html5/thumbnails/11.jpg)
The University of Adelaide, School of Computer Science 30 avril 2014
Chapter 2 — Instructions: Language of the Computer 11
21
Case Study 2 – Chap 1 (HP5)
Copyright © 2012, Elsevier Inc. All rights reserved.
22 Copyright © 2012, Elsevier Inc. All rights reserved.
![Page 12: Cours 01 - CAQA5e_ch1](https://reader031.fdocuments.us/reader031/viewer/2022020506/56d6bf1e1a28ab301694f350/html5/thumbnails/12.jpg)
The University of Adelaide, School of Computer Science 30 avril 2014
Chapter 2 — Instructions: Language of the Computer 12
23
Pour le prochain cours n Procurez-vous le livre obligatoire
n Hennessy & Patterson (H&P5), Computer Architecture: A Quantitative Approach, 5th Edition, Morgan Kaufmann, 2012
n Lire les pages 1-33 du chapitre 1 de H&P5 n Devoir à remettre la semaine prochaine
n Faire les problèmes 1.4 et 1.10 n Manuscrit. À remettre sur papier au début du cours. n Détaillez vos calculs. n Aucun retard ne sera accepté.
n À la semaine prochaine!
Copyright © 2012, Elsevier Inc. All rights reserved.