Jump to: navigation, search

Les unités en informatique

Cette page reprend les unités principales utilisées en informatique, que ce soit au niveau des composants ou de l'encodage des fichiers.

Bit, byte et octet

Bit

Concept fondamental en informatique, le bit[1] est un concept extrêment simple à comprendre: un bit ne peut avoir que deux valeurs: 0 ou éteint, 1 ou allumé. Il représente l'état d'un interrupteur. Toute l'informatique étant basée sur ce concept, on va donc utiliser un système binaire à l'intérieur de la machine.

Système décimal

Avant d'aborder la notation et les calculs dans le système binaire, un petit retour sur la notation courante des nombre est nécessaire.

Le système décimal[2] est utilisé dans l'enseignement occidental et est prédominant au niveau mondial. Il utilise une base 10.

Dans ce système, un nombre est exprimé avec les chiffres suivant: 0, 1, 2, 3, 4, 5, 6, 7, 8 et 9.

Pour représenter le nombre cent vingt trois, je n'ai pas assez de chiffres, le plus grand étant le nombre neuf. J'ai donc besoin de trois chiffres, le premier représentant la quantité de centaines, le deuxième la quantité de dizaine et le dernier la quantité d'unités. Je forme donc cette suite de chiffres: 123. Comme vous pouvez le constater dans la phrases précédente, la notation 123 et la notation cent vingt trois représentent le même nombre, le premier utilisant le système décimal, le deuxième la forme nominale française. Un nombre n'est donc pas une suite de chiffre, mais une valeur exprimée dans l'un ou l'autre système. Cette distinction est importante pour pouvoir bien comprendre le système binaire.

Pour résumer, le système décimal utilisant une base 10, à chaque fois qu'on atteint le nombre dix ou une de ses puissances, il nous faudra un chiffre supplémentaire pour noter le nombre.

Petit récapitulatif du fonctionnement de la notation des nombres dans le système décimal.

Nombre 103 102 101 Unités Commentaires
un 0 0 0 1 Ce nombre est exprimable avec un seul chiffre.
dix 0 0 1 0 Le chiffre exprimant le plus grand nombre étant le 9, il nous faut maintenant un chiffre supplémetaire pour exprimer le nombre dix. On note donc le chiffre 1 dans la colonne des dizaines et 0 dans celle des unités. On a atteint la première puisance de 10: 101
trente cinq 0 0 3 5 Deux positions suffisent toujours pour ce nombre.
cent vingt trois 0 1 2 3 Avec ce nombre, on dépasse la deuxième puissance de 10 ( 102). À partir de maintenant, il nous faudra trois chiffre pour exprimer les nombres.
neuf mille neuf cents nonante neuf 9 9 9 9 Ce nombre est le dernier notable avec 4 chiffres, puisque le suivant sera la cinquième puissance de 10 ( 105), à partir de laquelle il nous faudra cinq chiffres.

Une exception majeure à l'utilisation du système décimal dans le monde occidental est la notion du temps, qui a conserver une base 12 ou dodécimale[3]. Une journée est constistuée de 2 fois 12 heures par exemple. Voir à ce sujet la vidéo de Dr James Grime sur les avantages de la base 12

Système binaire

Les premières traces du système binaire remonte à la civilisation égyptienne (environ 3000 ans avant Jésus Christ)[4], il ne s'agit donc pas d'un système conçu pour l'informatique. Il a été adapté par les pionniers de l'informatique puisqu'il permettait de calculer avec des bits plutôt qu'avec les chiffres couramment utilisés en mathématiques.

Les chiffres à disposition dans le système binaire sont beaucoup plus réduit que dans le système décimal, puisqu'il sont au nombre de deux: 0 et 1.

Dans ce système, la base n'est plus 10 mais 2. Dès que le nombre à représenter atteint une puissance de 2, on aura besoin d'une position supplémentaire.

Nombre 24 23 22 21 Unités (20) Commentaires
un 0 0 0 0 1 Ce nombre est exprimable avec un seul chiffre.
deux 0 0 0 1 0 Le chiffre exprimant le plus grand nombre exprimable avec une seule position étant le 1, il nous faut maintenant une position supplémetaire pour exprimer le nombre deux. On note donc le chiffre 1 dans la colonne des dizaines binaires et 0 dans celle des unités. On a atteint la première puisance de 2: 21
trois 0 0 0 1 1 Deux positions suffisent toujours pour ce nombre puisqu'on ne dépasse pas la puissance de 2 suivante.
cinq 0 0 1 0 1 Trois positions sont nécessaires pour ce nombre: 1 x 4, 0 x 2 et 1 x 1.
12 0 1 1 0 0 1 x 8 et 1 x 4 suffisent pour exrpimer ce nombre.
31 1 1 1 1 1 Ce nombre est le plus grand exprimable avec cinq positions dans le système binaire, puisque le suivant est la cinquième puissance de 2, 32 (25), qui demanderait une sixième position.

Comme on peut vite s'en rendre compte, la diminution du nombre de chiffres disponibles, de 10 à 2 dans ce cas, implique l'utilisation de beaucoup plus de chiffres pour exprimer le même nombre.

Par exemple, le nombre cent vingt trois:

3 caractères dans la notation décimale

100 ~ 103 10 ~ 101 1 ~ 100
1 2 3

7 caractères dans la notation binaire

64 ~ 26 32 ~ 25 16 ~ 24 8 ~ 23 4 ~ 22 2 ~ 21 1 ~ 20
1 1 1 1 0 1 1

Dans les deux cas, nous pouvons vérifier la notation en additionnant les nombres notés dans chaque colonne:

  • 123 = ( 1 x 100 ) + ( 2 x 10 ) + ( 3 x 1 )
  • 123 = ( 1 x 64 ) + ( 1 x 32 ) + ( 1 x 16 ) + ( 1 x 8 ) + ( 0 x 4 ) + ( 1 x 2 ) + ( 1 x 1 )

Le nombre représenté est le même, comme quand j'écris cent vingt trois en toutes lettres. C'est juste le système de notation qui varie.

L'addition de deux nombre binaires suit le même raisonnement qu'en décimal:

nombre 32 ~ 25 16 ~ 24 8 ~ 23 4 ~ 22 2 ~ 21 1 ~ 20
12 0 0 1 1 0 0
7 0 0 0 1 1 1
additionné l'un à l'autre
19 0 1 0 0 1 1

Physicalité

Pour terminer avec le bit, il est fondamental de comprendre que toute information traitée par un CPU doit être encodée en une suite de 0 et de 1. Ce qui implique que toute image, son, vidéo, texte ou logiciel est représenté de cette manière en informatique.

Le bit n'est pas un concept abstrait comme le sont les chiffres du système décimal. Il a une physicalité quand il est inscrit sur un support de masse. A cet égard, la surface d'un DVD vue au microscope est éclairante:

Dvd-imm.jpg

Sur cette image, on peut voir plusieurs lignes constituées d'une succession de zones noires et de zones réfléchissantes, correspondant à une suite de 0 (les zones noires) et de 1 (les zones réfléchissantes). Un DVD pouvant contenir des programmes, du sons ou des vidéos, la relation entre les bits et les données informatiques devient claire.

Byte

Le Byte[5] ou octet[6] est le plus petit groupe de bits traitable par un ordinateur. Il comporte 8 bits. Sa valeur maximum est donc de 255.

128 ~ 27 64 ~ 26 32 ~ 25 16 ~ 24 8 ~ 23 4 ~ 22 2 ~ 21 1 ~ 20
1 1 1 1 1 1 1 1

La somme des puissances de 2 inférieures à 8 donne le nombre 255.

On le retrouve aussi bien dans le texte que dans les images.

Par exemple, quand une touche du clavier est enfoncée, l'information transitant entre le clavier et l'ordinateur n'est pas un symbole graphique mais un byte représentant cette lettre. L'alphabet latin comportant peu de lettres, 255 valeurs suffisent à décrire tous les caractères non accentuées, en minuscule et en majuscule. Au-delà, pour les caractères spéciaux ou les langues utilisant plus de 255 caractères différents, comme le chinois, il faudra passer 2 bytes ou plus par caractère. Voir ci-dessous l'extrait du tableau des caractères imprimables.

Binaire Octal Dec Hex Glyphe
100 0001 101 65 41 A
100 0010 102 66 42 B
100 0011 103 67 43 C
100 0100 104 68 44 D
100 0101 105 69 45 E
100 0110 106 70 46 F
100 0111 107 71 47 G
100 1000 110 72 48 H
100 1001 111 73 49 I
100 1010 112 74 4A J
100 1011 113 75 4B K
100 1100 114 76 4C L
100 1101 115 77 4D M
100 1110 116 78 4E N
100 1111 117 79 4F O
101 0000 120 80 50 P
101 0001 121 81 51 Q
101 0010 122 82 52 R
101 0011 123 83 53 S
101 0100 124 84 54 T
101 0101 125 85 55 U
101 0110 126 86 56 V
101 0111 127 87 57 W
101 1000 130 88 58 X
101 1001 131 89 59 Y
101 1010 132 90 5A Z
110 0001 141 97 61 a
110 0010 142 98 62 b
110 0011 143 99 63 c
110 0100 144 100 64 d
110 0101 145 101 65 e
110 0110 146 102 66 f
110 0111 147 103 67 g
110 1000 150 104 68 h
110 1001 151 105 69 i
110 1010 152 106 6A j
110 1011 153 107 6B k
110 1100 154 108 6C l
110 1101 155 109 6D m
110 1110 156 110 6E n
110 1111 157 111 6F o
111 0000 160 112 70 p
111 0001 161 113 71 q
111 0010 162 114 72 r
111 0011 163 115 73 s
111 0100 164 116 74 t
111 0101 165 117 75 u
111 0110 166 118 76 v
111 0111 167 119 77 w
111 1000 170 120 78 x
111 1001 171 121 79 y
111 1010 172 122 7A z

Pour les curieux, une petite histoire de l'apparition du mot byte par le professeur Brailsford de l'université de Nottingham.

Préfixes

Le byte est l'unité utilisée pour mesurer la mémoire ou la bande passante de la plupart des composants d'un ordinateur.

Comme pour les unités de poids ou de distance, les préfixes utilisés définissent la valeur de l'exposant, la puissance à laquelle il faut mettre le base.

Par exemple, un kilomètre représente 1000 mètres, qui peut se noter 103 mètres, le mega représente un million, ou 106, et ainsi de suite pour le tera, le peta, etc.

Cette même règle est adaptable aux unités informatiques, bien qu'il faut se méfier d'un traduction trop directe.

La valeur des puissances de 2 augmente beaucoup moins vite que celle des puissances de 10. Par exemple, 26 ne vaut que 64, alors que 106 vaut déjà 1.000.000. La proposition des informaticiens au début des années 70 était de nommer kilo, mega, tera, etc., non pas les puissances de 2 multiples de 3 mais les puissances multiples de 10. Un kilobit désignait 210(1024), le megabit 220 (1048576 ou 1024 kilobits) et ainsi de suite. Cette proposition avait l'avantage d'utiliser la base 2, naturelle en informatique, tout en restant proche de la valeur des préfixes de la base 10, facilitant la représentation mentale des nombres. Malgré l'élégance de la solution, la différence des valeurs représentées par les préfixes en base 2 et celles de la base 10 a causé assez de malentendus pour qu'à la fin des années 90 plusieurs groupes fassent pression sur l'International Organization for Standardization[7] afin de produire une norme claire concernant l'utilisation de ces préfixes. La décision fut de créer d'autres préfixes pour la base 2, et de conserver la dénomination kilo, mega, tera, etc., pour désigner des puissances de 10. Le tableau ci-dessous reprend les préfixes et leur valeur:

Quantité de bits
Decimal
Valeur SI
1000 103 kbit kilobit
10002 106 Mbit megabit
10003 109 Gbit gigabit
10004 1012 Tbit terabit
10005 1015 Pbit petabit
10006 1018 Ebit exabit
10007 1021 Zbit zettabit
10008 1024 Ybit yottabit
Binary
Valeur IEC JEDEC
1024 210 Kibit kibibit Kbit kilobit
10242 220 Mibit mebibit Mbit megabit
10243 230 Gibit gibibit Gbit gigabit
10244 240 Tibit tebibit -
10245 250 Pibit pebibit -
10246 260 Eibit exbibit -
10247 270 Zibit zebibit -
10248 280 Yibit yobibit -

Pour résumer, les unités courantes telles le Mb ou le Gb sont un nombre de bits exprimés en puissance de 10 et non en puissance de 2

Pixel

Le pixel est la brique fondamentale d'un écran. Pour les écrans qui affichent les couleurs, ce pixel est en constitué de 3 zones ou canaux différents, émettant chacune un couleur unique:

  • R pour red ou rouge.
  • G pour green ou vert.
  • B pour blue ou bleu.


La position physique de ces 3 canaux est variable. Voici quelques organisation de ces canaux dans différents types d'écran:

600px-Pixel geometry 01 Pengo.jpg

Les images à afficher sur un écran doivent donc décrire ces trois valeurs pour chaque pixel. La plus petite partie d'une image est donc elle aussi un pixel.

Pixels highres shaded.jpg

Résolution

Un écran est une grille de pixels à deux dimensions. La résolution d'un écran indique les dimensions de cette grille, le nombre de pixels en largeur et en hauteur. Ces dimensions sont standardisées en ce qui concerne les écrans grand public[8]. Les tailles les plus fréquentes sont:

  • 4K, ou 4096 x 2160 pixels, ou 4 x HD (2 x en largeur, 2x en hauteur).
  • HD, ou 1920 x 1080 pixels, un des format les plus répandu.
  • XGA, ou 1024 x 768 pixels, format ancien.
  • SVGA, ou 800 x 600 pixels , format très ancien.
  • VGA, ou 640 x 480 pixels , format très ancien.
  • PAL, ou 768 x 576 pixels, quasiment de l'ordre de l'archéologie puisqu'il s'agit d'un standard venant de la télévision avec tube cathodique des années 60.


Liste complète des résolutions standards:

1920px-Vector Video Standards8.svg.png

Pour avoir une idée plus précise du fonctionnement d'un écran, voir la vidéo ci-dessous, filmé en haute vitesse.

La résolution d'une image numérique suit la même logique.

Byte et couleur

La majorité des écrans et la majorité des images numériques utilisent 1 byte d'information par canal. Un byte contenant 8 bits, pouvent exprimer 28 valeurs différentes, chaque canal d'un pixel peut varier de 0 à 255, 0 voulant dire éteint, et 255 allumé au maximum. On compte donc 256 valeurs différentes, le 28.

Chaque canal RGB pouvant varier de 0 à 255, on peut décrire 256 * 256 * 256 couleurs différentes ou 16.777.216 de couleurs. Ce nombre est plus grand que le nombre de couleurs discernables par l'oeil humain et pourtant il ne permet pas d'afficher toutes les nunaces perceptibles. Voir le point concernant la synthèse additive.

Les images et écrans utilisant 3 fois 8 bits par pixels ont une profondeur de couleur de 24 bits. Dans les formats de fichiers supportant la transparence, on ajoute un canal alpha. On parle alors de fichiers en 32 bits. La place nécessaire pour stocker une image de 1000 x 1000 pixels contenant chacun 24 bits d'information est de 24 millions de bits, ou 24 Mb. Les écrans HD doivent eux être capables de modifier 30 fois par secondes un peu moins de 50 millions de pixels, ce qui représente un flux de 1500 millions de bits par secondes, ou 1.5 Gbit/seconde. C'est à cause de l'augmentation de la résolution des écrans et de ces énormes quantités de données à traiter très rapidement que les GPU sont aujourd'hui un composant nécessaire des ordinateurs.

A titre de comparaison, les ordinateurs anciens n'avaient pas capacité de traiter ce genre flux. Ils décrivaient la couleur en utilisant beaucoup moins de bits, 8 ou 16. Le mouvement 8bits ré-explore le potentiel esthétique de ce genre de limitations.

Vangogh-8-bit-art-7.jpg


Logo-e8b.png

Voir le documentaire Europe in 8 Bits de Javier Polo.

Additif et soustractif

Les longeurs d'ondes des 3 canaux RGB ont été choisies pour que, une fois allumés à leur puissance maximale, elles puissent en se mélangeant afficher du blanc. Contrairement au papier, un pixel éteint est noir. On crée l'image en ajoutant de la lumière. Ce processus est l'inverse de celui utiliser pour l'impression, le dessin, la peinture, la photographie ou n'importe quel autre procédé utilisant des pigments. La base est généralement une surface blanche ou très claires, de laquelle on retire de la lumière en ajoutant du pigment. On appelle ces deux procédés synthèse additive[9] dans le cas d'un écran (on part du noir et on ajoute de la lumière) et synthèse soustractive[10] pour les impressions (on part du blanc et on enlève de la lumière).

Synthèse additive (écran) Synthèse soustractive (papier, toile)
420px-Synthese+.svg.png 420px-Synthese-.svg.png

Les couleurs primaires des deux types de synthèse ne sont pas les mêmes. En impression industrielle, on retrouve un jeu de 4 valeurs:

  • C pour cyan.
  • M pour magenta.
  • Y pour yellow ou jaune.
  • K pour black ou noir.

Comme les schémas essaient de le montrer, certaines valeurs possibles en additif ne sont pas présentent dans le soustractif, le rouge pur par exemple, et inversément.

Il est important de comprendre que les écrans fonctionnant en RGB, il leur est impossible d'afficher directement les couleurs d'un fichier utilisant le format CMYK. La conversion des couleurs CMYK du fichier vers le RGB des pixels de l'écran est faite programmatiquement. Pour un pixel J (jaune) à 100% en CMYK, on allume le canal rouge à 100% et le canal vert à 90% par exemple. Les paramètres de ce traitement sont influencés par les profils couleurs, ou profil ICC[11].

Hertz

Wave frequency.gif

Le hertz[12] décrit le nombre d'oscillation par seconde d'une onde, qu'il s'agisse d'électricité ou de son. Une onde à 1 Hz fait un cycle complet en une seconde. Une onde à 100 Hz fait 100 cycles par secondes.

Cette unité est utilisée en informatique pour décrire la vitesse à laquelle un processeur peut effectuer les opérations. Un processeur cadencé à 3GHz effectuera donc 3 milliads de cycles par secondes, soit deux fois plus qu'un processeur cadencé à 1.5GHz. Voir cycle des processeurs.

Références

  1. Définition du bit informatique sur wikipedia.
  2. Voir la définition du système décimal sur wikipedia
  3. Le système dodécimal ou duodecimal en anglais a été mis au point en Égypte ancienne, voir wikipedia
  4. Voir la définition du système binaire sur wikipedia
  5. Voir définition du byte informatique sur wikipedia.
  6. Voir définition de l'octet sur wikipedia.
  7. À ce propos: Adoption des préfixes par l'IEC, le NIST and l'ISO
  8. Voir la liste complète des résolutions standards sur wikipeida
  9. Voir la définition de synthèse additive sur wikipedia
  10. Voir la définition de synthèse additive sur wikipedia
  11. Les profils ICC ou Inetrnational Color Consortium, sont des normes internationales contrôlant la conversion des couleurs entre différents mode colorimétriques. Voir wikipedia et le site officiel de l'ICC.
  12. Voir l'explication complète du hertz sur wikipedia.