Cours 01 - CAQA5e_ch1

12
The University of Adelaide, School of Computer Science 30 avril 2014 Chapter 2 — Instructions: Language of the Computer 1 1 Copyright © 2012, Elsevier Inc. All rights reserved. Chapitre 1 Historique et éléments de base pour une analyse quantitative. Computer Architecture A Quantitative Approach, Fifth Edition 2 Plan de la présentation Historique Progression technologique Tendances actuelles Enjeux actuels Dissipation de la puissance Consommation d’énergie Copyright © 2012, Elsevier Inc. All rights reserved.

description

Cours 1

Transcript of Cours 01 - CAQA5e_ch1

Page 1: Cours 01 - CAQA5e_ch1

The University of Adelaide, School of Computer Science 30 avril 2014

Chapter 2 — Instructions: Language of the Computer 1

1 Copyright © 2012, Elsevier Inc. All rights reserved.

Chapitre 1

Historique et éléments de base pour une analyse quantitative.

Computer Architecture A Quantitative Approach, Fifth Edition

2

Plan de la présentation

n  Historique n  Progression technologique

n  Tendances actuelles n  Enjeux actuels

n  Dissipation de la puissance n  Consommation d’énergie

Copyright © 2012, Elsevier Inc. All rights reserved.

Page 2: Cours 01 - CAQA5e_ch1

The University of Adelaide, School of Computer Science 30 avril 2014

Chapter 2 — Instructions: Language of the Computer 2

3 Copyright © 2012, Elsevier Inc. All rights reserved.

Technologies des systèmes ordinés

n  Amélioration de la performance: n  Au niveau des semiconducteurs

n  Vitesse d’horloge, grandeur du transistor n  Au niveau de l’architecture

n  Architectures RISC n  Pipeline, “scheduling” dynamique , VLIW,

superscalaires n  Processeurs multicoeurs

n  Résultats obtenus: n  Ordinateurs légers, rapides, autonomes n  Une gestion basée sur la productivité

4 Copyright © 2012, Elsevier Inc. All rights reserved.

Performance des processeurs

RISC

Apparition du multiprocesseur

Page 3: Cours 01 - CAQA5e_ch1

The University of Adelaide, School of Computer Science 30 avril 2014

Chapter 2 — Instructions: Language of the Computer 3

5 Copyright © 2012, Elsevier Inc. All rights reserved.

Tendances actuelles n  Depuis 2003, il est difficile d’améliorer la

performance d’un processeur à coeur unique. n  On a atteint une limite définie par la capacité du

processeur à dissiper sa propre chaleur! n  Grande demande d’appareils portables (tablettes,

téléphones intelligents) n  Nouveaux modèles explorés:

n  Data-level parallelism (DLP) n  Thread-level parallelism (TLP) n  Request-level parallelism (RLP)

n  Ces nouvelles tendances requièrent que les applications soient restructurées.

6 Copyright © 2012, Elsevier Inc. All rights reserved.

Classes d’ordinateurs n  Personal Mobile Device (PMD)

n  Téléphones intelligents, tablettes n  Enjeux: efficience énergétique, réponse en temps réel.

n  Ordinateur de bureau n  Enjeux: prix vs performance

n  Serveurs n  Enjeux: disponibilité, capacité de traitement, “scalability”.

n  “Clusters / Warehouse Scale Computers” n  Utilisés pour “Software as a Service (SaaS)” n  Enjeux: disponibilité, prix vs performance

n  Systèmes embarqués n  Enjeux: le prix

Page 4: Cours 01 - CAQA5e_ch1

The University of Adelaide, School of Computer Science 30 avril 2014

Chapter 2 — Instructions: Language of the Computer 4

7 Copyright © 2012, Elsevier Inc. All rights reserved.

Parallélisme n  Afin d’accélérer le traitement de l’information,

plusieurs stratégies de parallélisme sont utilisées. n  Instruction-Level Parallelism (ILP) n  Vector architectures/Graphic Processor Units (GPUs) n  Thread-Level Parallelism n  Request-Level Parallelism

8 Copyright © 2012, Elsevier Inc. All rights reserved.

Taxonomie de Flynn n  Single instruction stream, single data stream (SISD)

n  Single instruction stream, multiple data streams (SIMD) n  Architectures vectorielles n  Extensions Multimedia (ex. MMX, SSE) n  Processeur graphique (GPU)

n  Multiple instruction streams, single data stream (MISD) n  Aucune implémentation commerciale

n  Multiple instruction streams, multiple data streams (MIMD) n  Multicoeurs

Page 5: Cours 01 - CAQA5e_ch1

The University of Adelaide, School of Computer Science 30 avril 2014

Chapter 2 — Instructions: Language of the Computer 5

9 Copyright © 2012, Elsevier Inc. All rights reserved.

Tendances technologiques n  Circuits intégrés

n  Densité des transistors: 35%/année n  Grandeur du masque: 10-20%/année n  Intégration globale: 40-55%/année

n  Capacité de la mémoire DRAM: 25-40%/année

n  Capacité de la mémoire Flash: 50-60%/année n  De 15 à 20 fois moins cher que le DRAM

n  Disques magnétiques: 40%/année n  De 15 à 25 fois moins cher que le Flash n  De 300 à 500 fois moins cher que le DRAM

10 Copyright © 2012, Elsevier Inc. All rights reserved.

Bande passante et temps réponse

n  Bande passante (“throughput”) n  Somme de travail pouvant être réalisée par unité de

temps. n  Processeurs: amélioration de 10,000 à 25,000 fois. n  Mémoire et disques: amélioration de 300 à 1200 fois.

n  Temps réponse (“Latency”) n  Temps requis entre le début et la fin d’un événement. n  Processeurs: amélioration de 30 à 80 fois n  Mémoire et disques: amélioration de 6 à 8 fois

Page 6: Cours 01 - CAQA5e_ch1

The University of Adelaide, School of Computer Science 30 avril 2014

Chapter 2 — Instructions: Language of the Computer 6

11 Copyright © 2012, Elsevier Inc. All rights reserved.

Bande passante et temps réponse

Log-log plot of bandwidth and latency milestones

12 Copyright © 2012, Elsevier Inc. All rights reserved.

Transistors et connexions n  Grandeur des transistors sur le masque

n  10 microns en 1971 à .032 microns in 2011

n  La performance s’améliore linéairement avec la grandeur du transistor

n  Plus le transistor est petit, plus il réagit rapidement.

n  La capacité d’intégration s’améliore de façon quadratique avec la grandeur du transistor.

n  Plus le transistor est petit, moins il dissipe d’énergie.

Page 7: Cours 01 - CAQA5e_ch1

The University of Adelaide, School of Computer Science 30 avril 2014

Chapter 2 — Instructions: Language of the Computer 7

13

Microarchitecture Intel Core

Copyright © 2012, Elsevier Inc. All rights reserved.

Référence: Wikipedia

14 Copyright © 2012, Elsevier Inc. All rights reserved.

Puissance n  Intel 80386 ~ 2 W

n  3.3 GHz Intel Core i7 - 130 W

n  La chaleur doit toujours être dissipée d’une puce de 1.5 x 1.5 cm

n  130W est la limite de ce qui peut être refroidi par de l’air

Page 8: Cours 01 - CAQA5e_ch1

The University of Adelaide, School of Computer Science 30 avril 2014

Chapter 2 — Instructions: Language of the Computer 8

15 Copyright © 2012, Elsevier Inc. All rights reserved.

Énergie et puissance dynamiques

n  Énergie dynamique n  À toutes les fois qu’un transistor passe de 0 à 1 ou de

1 à 0 n  ½ x Charge capacitive x Voltage2

n  Puissance dynamique n  ½ x Charge capacitive x Voltage2 x Fréquence

n  Lorsqu’on réduit la fréquence de l’horloge, on réduit la puissance, pas l’énergie

16 Copyright © 2012, Elsevier Inc. All rights reserved.

Puissance statique n  La puissance statique consommée:

n  Courantstatic x Voltage n  Varie avec le nombre de transistors

Page 9: Cours 01 - CAQA5e_ch1

The University of Adelaide, School of Computer Science 30 avril 2014

Chapter 2 — Instructions: Language of the Computer 9

17

Exemple p.22 (energy consumption)

Le processeur A consomme 20% plus de puissance que le processeur B. Mais le processeur A peut exécuter le même code en 70% du temps que le ferait le processeur B. Quel processeur a la meilleure performance énergétique?

Copyright © 2012, Elsevier Inc. All rights reserved.

P: puissance consommée durant l’exécution d’une tâche T: temps d’exécution d’une tâche E: énergie PA = PB *1.2 TA = TB * 0.7 EA = PA * TA= (PB * 1.2) * (TB * 0.7) = PB * TB * 0.84 EB = PB * TB EA/EB = 0.84 è Le processeur A a la meilleure performance énergétique.

18

Exemple p.23 (energy & power)

Un processeur fonctionne avec une réduction de 15% de son voltage nominal et une réduction de 15% de sa fréquence nominale. Quel est l’impact sur l’énergie et la puissance dynamique consommées?

Copyright © 2012, Elsevier Inc. All rights reserved.

E’/E = V’2 / V2 E’/E = (V * 0.85)2 / V2 E’/E = 0.72 è On réalise une économie énergétique de (1 - 0.72) soit 28% P’/P = V’2 * Freq’ / V2 * Freq P’/P = V’2 / V2 * Freq’ / Freq P’/P = 0.72 * 0.85 P’/P = 0.61 è On réalise une économie de puissance de (1 – 0.61) soit 39%

Page 10: Cours 01 - CAQA5e_ch1

The University of Adelaide, School of Computer Science 30 avril 2014

Chapter 2 — Instructions: Language of the Computer 10

19 Copyright © 2012, Elsevier Inc. All rights reserved.

Puissance et énergie n  Le problème: comment dissiper la puissance n  Un paramètre couramment utilisé est le “Thermal

Design Power” (TDP) n  Le TDP caractérise la consommation continue en

puissance d’un “chip”. n  Il est utilisé pour déterminer l’alimentation et le

système de refroidissement nécessaires. n  Plus petit que la puissance maximum n  Plus grand que la puissance moyenne

20 Copyright © 2012, Elsevier Inc. All rights reserved.

Puissance et énergie n  La vitesse d’horloge peut être réduite

dynamiquement pour limiter la consommation de puissance.

n  Les technologies émergentes stoppent certaines fonctions du chip pour réduire la puissance consommée.

n  L’énergie par tâche est souvent une meilleure mesure (notamment pour les serveurs)

n  La consommation d’énergie est importante pour les appareils portables (téléphones intelligents, tablettes, etc.)

Page 11: Cours 01 - CAQA5e_ch1

The University of Adelaide, School of Computer Science 30 avril 2014

Chapter 2 — Instructions: Language of the Computer 11

21

Case Study 2 – Chap 1 (HP5)

Copyright © 2012, Elsevier Inc. All rights reserved.

22 Copyright © 2012, Elsevier Inc. All rights reserved.

Page 12: Cours 01 - CAQA5e_ch1

The University of Adelaide, School of Computer Science 30 avril 2014

Chapter 2 — Instructions: Language of the Computer 12

23

Pour le prochain cours n  Procurez-vous le livre obligatoire

n  Hennessy & Patterson (H&P5), Computer Architecture: A Quantitative Approach, 5th Edition, Morgan Kaufmann, 2012

n  Lire les pages 1-33 du chapitre 1 de H&P5 n  Devoir à remettre la semaine prochaine

n  Faire les problèmes 1.4 et 1.10 n  Manuscrit. À remettre sur papier au début du cours. n  Détaillez vos calculs. n  Aucun retard ne sera accepté.

n  À la semaine prochaine!

Copyright © 2012, Elsevier Inc. All rights reserved.