Cours gratuits » Cours informatique » Cours programmation » Cours langage C » Formation de base complet sur le langage c : developpez

Formation de base complet sur le langage c : developpez


Télécharger



★★★★★★★★★★3.5 étoiles sur 5 basé sur 1 votes.
Votez ce document:

Formation de base complet sur le langage c : developpez

...

I-B - Considérations lexicales

I-B-1 - Présentation du texte du programme

Le programmeur est maitre de la disposition du texte du programme. Des blancs, des tabulations et des sauts à la ligne peuvent être placés à tout endroit ou cela ne coupe pas un identificateur, un nombre ou un symbole composé2.

Les commentaires commencent par /* et se terminent par */ :

/*

Ce texte est un commentaire et sera donc ignoré par le compilateur */

Les commentaires ne peuvent pas être imbriqués : écrit dans un programme, le texte « /* voici un grand

/* et un petit */ commentaire */ » est erroné, car seul « /* voici un grand /* et un petit */ » sera

vu comme un commentaire par le compilateur.

Les langages C et C++ cohabitant dans la plupart des compilateurs actuels, ces derniers acceptent également comme commentaire tout texte compris entre le signe // et la fin de la ligne ou ce signe apparait :

// Ceci est un commentaire à la mode C++.

Le caractère anti-slash \ précédant immédiatement un saut à la ligne masque ce dernier : la ligne suivante est considérée comme devant être concaténée à la ligne courante. Cela est vrai en toute circonstance, y compris à l'intérieur d'une chaine de caractères. Par exemple, le texte message = "anti\ constitutionnellement";

est compris comme ceci : « message = "anti constitutionnellement" ; »

* 2 Néanmoins, les directives pour le préprocesseur (cf. section 8.1) doivent comporter un # dans la première position de la ligne. Cela ne constitue pas une exception à la règle donnée ici, car le préprocesseur n'est pas le compilateur C et ne travaille pas sur la syntaxe du langage.

I-B-2 - Mots-clés

Les mots suivants sont réservés. Leur fonction est prévue par la syntaxe de C et ils ne peuvent pas être utilisés dans un autre but :

...

I-B-3 - Identificateurs

Un identificateur est une suite de lettres et chiffres contigus, dont le premier est une lettre. Lorsque seul le compilateur est concerné, c'est-à-dire lorsqu'il s'agit d'identificateurs dont la portée est incluse dans un seul fichier (nous dirons de tels identificateurs qu'ils sont privés) :

  • en toute circonstance une lettre majuscule est tenue pour différente de la lettre minuscule correspondante ;
  • dans les identificateurs, le nombre de caractères discriminants est au moins de 31.

  Attention, lorsqu'il s'agit d'identificateurs externes, c'est-à-dire partagés par plusieurs fichiers sources, il est possible que sur un système particulier l'éditeur de liens sous-jacent soit trop rustique pour permettre le respect de ces deux prescriptions.

Le caractère _(appelé « blanc souligné ») est considéré comme une lettre ; il peut donc figurer à n'importe quelle place dans un identificateur. Cependant, par convention un programmeur ne doit pas utiliser des identi- ficateurs qui commencent par ce caractère. Cela assure qu'il n'y aura jamais de conflit avec les noms introduits (à travers les fichiers « .h ») pour les besoins des bibliothèques, car ces noms commencent par un tel blanc souligné. ~

I-B-4 - Opérateurs

Symboles simples :

( ) [ ] . ! ~ < > ? :

= , + - * / % | & ^

Symboles composés :

-> ++ -- <= >= == != && || << >>

+= -= *= /= %= <<= >>= |= &= ^=

Tous ces symboles sont reconnus par le compilateur comme des opérateurs. Il est interdit d'insérer des caractères blancs à l'intérieur d'un symbole composé. En outre, il est conseillé d'encadrer par des blancs toute utilisation d'un opérateur. Dans certaines circonstances cette règle est plus qu'un conseil, car sa non-observance crée une expression ambiguÂe.

I-C - Constantes littérales

I-C-1 - Nombres entiers

Les constantes littérales numériques entières ou réelles suivent les conventions habituelles, avec quelques particularités.

Les constantes littérales sont sans signe : l'expression ¡123 est comprise comme l'application de l'opérateur unaire ¡ à la constante 123 ; mais puisque le calcul est fait pendant la compilation, cette subtilité n'a aucune conséquence pour le programmeur. Notez aussi qu'en C original, comme il n'existe pas d'opérateur + unaire, la notation +123 est interdite.

Les constantes littérales entières peuvent aussi s'écrire en octal et en hexadécimal :

  • une constante écrite en octal (base 8) commence par 0 (zéro) ;
  • une constante écrite en hexadécimal (base 16) commence par 0x ou 0X. Voici par exemple trois manières d'écrire le même nombre :

27 033 0x1B

Détail à retenir : on ne doit pas écrire de zéro non significatif à gauche d'un nombre : 0123 ne représente pas la même valeur que 123.

Le type d'une constante entière est le plus petit type dans lequel sa valeur peut être représentée. Ou, plus exactement :

  • si elle est décimale : si possible int, sinon long, sinon unsigned long ;
  • si elle est octale ou hexadécimale : si possible int, sinon unsigned int, sinon unsigned long.

Certains su±xes permettent de changer cette classification :

  • U, u : indique que la constante est d'un type unsigned ;
  • L, l : indique que la constante est d'un type long. Exemples : 1L, 0x7FFFU. On peut combiner ces deux su±xes : 16UL.

I-C-2 - Nombres flottants

Une constante littérale est l'expression d'un nombre flottant si elle présente, dans l'ordre :

  • une suite de chiffres décimaux (la partie entière),
  • un point, qui joue le role de virgule décimale,
  • une suite de chiffres décimaux (la partie fractionnaire),
  • une des deux lettres E ou e,
  • éventuellement un signe + ou -,
  • une suite de chiffres décimaux.

Les trois derniers éléments forment l'exposant. Exemple : 123.456E-78.

On peut omettre :

  • la partie entière ou la partie fractionnaire, mais pas les deux,
  • le point ou l'exposant, mais pas les deux. Exemples : .5e7, 5.e6, 5000000., 5e6

Une constante flottante est supposée de type double, à moins de comporter un su±xe explicite :

  • les su±xes F ou f indiquent qu'elle est du type float ;
  • les su±xes L ou l indiquent qu'elle est du type long double. Exemples : 1.0L, 5.0e4f

I-C-3 - Caractères et chaines de caractères

Une constante de type caractère se note en écrivant le caractère entre apostrophes. Une constante de type chaine de caractères se note en écrivant ses caractères entre guillemets. Exemples, trois caractères :

'A' '2' '"'

Quatre chaines de caractères :

"A" "Bonjour à tous !" "" "'"

On peut faire figurer n'importe quel caractère, même non imprimable, dans une constante caractère ou chaine de caractères en utilisant les combinaisons suivantes, appelées séquences d'échappement :

\n nouvelle ligne (LF) \t tabulation (HT)

\b espace-arrière (BS) \r retour-chariot (CR) \f saut de page (FF) \a signal sonore (BELL) \\ \

' '

" "

\d3d2d1 le caractère qui a pour code le nombre octal d3d2d1. S'il commence par un ou deux zéros et si cela ne crée pas une ambiguÂ3té, on peut aussi le noter \d2d1 ou \d1

Par exemple, la chaine suivante définit la suite des 9 caractères 3 A, escape (de code ASCII 27), B, ", C, saut de page, D, \ et E :

"A\033B\"C\fD\\E"

Une constante de type caractère appartient au type char, c'est-à-dire entier représenté sur un octet. La valeur d'une constante caractère est le nombre qui représente le caractère de manière interne ; de nos jours il s'agit presque toujours du code ASCII 4.

Une constante de type chaine de caractères représente une suite finie de caractères, de longueur quelconque. Le codage interne d'une chaine de caractères est le suivant (voyez la figure 1) :

  • les caractères constituant la chaine sont rangés en mémoire, de manière contiguÂe, dans l'ordre ou ils figurent dans la chaine ;
  • un caractère nul est ajouté immédiatement après le dernier caractère de la chaine, pour en indiquer la fin ;
  • la constante chaine représente alors, à l'endroit ou elle est écrite, l'adresse de la cellule ou a été rangé le premier caractère de la chaine

Fig. 1 - Représentation de la chaine 'Bonjour'

Par conséquent, une constante chaine de caractères a pour type celui d'un tableau de caractères (c'est-à-dire « char[] ») et pour valeur l'adresse d'une cellule de la mémoire. Par caractère nul on entend le caractère dont le code interne est 0 ; on peut le noter indifféremment 0, '\000' ou '\0' (mais certainement pas '0') ; il est utilisé très fréquemment en C. Notez que, dans une expression, '\0' est toujours interchangeable avec 0.

* 3Nous verrons qu'en fait cette chaine comporte un caractère de plus qui en marque la fin.

* 4En standard le langage C ne prévoit pas le codage Unicode des caractères.

I-C-4 - Expressions constantes

Une expression constante est une expression de l'un des types suivants :

  • toute constante littérale ; exemples : 1, 'A', "HELLO", 1.5e-2 ;
  • une expression correcte formée par l'application d'un opérateur courant (arithmétique, logique, etc.) à une ou deux expressions constantes ; exemples : -1, 'A' - 'a', 2 * 3.14159265, "HELLO" + 6 ;
  • l'expression constituée par l'application de l'opérateur & (opérateur de calcul de l'adresse, voyez la section 2.2.10) à une variable statique, à un champ d'une variable statique de type structure ou à un élément d'un tableau statique dont le rang est donné par une expression constante ; exemples : &x, &fiche.nom, &table[50] ;
  • l'expression constituée par l'application de l'opérateur sizeof à un descripteur de type. Exemples : sizeof(int), sizeof(char *) ;
  • l'expression constituée par l'application de l'opérateur sizeof à une expression quelconque, qui ne sera pas évaluée ; exemples : sizeof x, sizeof(2 * x + 3).

Les expressions constantes peuvent être évaluées pendant la compilation. Cela est fait à titre facultatif par les compilateurs de certains langages. En C ce n'est pas facultatif : il est garanti que toute expression constante (et donc toute sous-expression constante d'une expression quelconque) sera effectivement évaluée avant que l'exécution ne commence. En termes de temps d'exécution, l'évaluation des expressions constantes est donc entièrement « gratuite ».

I-D - Types fondamentaux

...

Le tableau 1 présente l'ensemble des types connus du compilateur C. L'organisation générale de cet ensemble est évidente : on dispose de deux sortes de types de base, les nombres entiers et les nombres flottants, et d'une famille infinie de types dérivés obtenus en appliquant quelques procédés récursifs de construction soit à des types fondamentaux soit à des types dérivés définis de la même manière.

Cette organisation révèle un trait de l'esprit de C : le pragmatisme l'emporte sur l'esthétisme, parfois même sur la rigueur. Dans d'autres langages, les caractères, les booléens, les constantes symboliques, etc., sont codés de manière interne par des nombres, mais ce fait est o±ciellement ignoré par le programmeur, qui reste obligé de considérer ces données comme appartenant à des ensembles disjoints. En C on a fait le choix opposé, laissant au programmeur le soin de réaliser lui-même, à l'aide des seuls types numériques, l'implantation des types de niveau supérieur.

I-D-1 - Nombres entiers et caractères

La classification des types numériques obéit à deux critères :

  • Si on cherche à représenter un ensemble de nombres tous positifs on pourra adopter un type non signé ; au contraire si on doit représenter un ensemble contenant des nombres positifs et des nombres négatifs on devra utiliser un type signé 5.
  • Le deuxième critère de classification des données numériques est la taille requise par leur représentation.

Comme précédemment, c'est un attribut d'un ensemble, et donc d'une variable devant représenter tout élément de l'ensemble, non d'une valeur particulière. Par exemple, le nombre 123 considéré comme un élément de l'ensemble f0 ::: 65535g est plus encombrant que le même nombre 123 quand il est considéré comme un élément de l'ensemble f0 ::: 255g.

Avec N chiffres binaires (ou bits) on peut représenter :

  • soit les 2N nombres positifs 0; 1; ::: 2N ¡ 1 (cas non signé) ;
  • soit les 2N nombres positifs et négatifs ¡2N¡1; ::: 2N¡1 ¡ 1 (cas signé).

De plus, la représentation signée et la représentation non signée des éléments communs aux deux domaines (les nombres 0; 1; ::: 2N-1 - 1) coÂ3ncident.

Le type caractère. Un objet de type char peut être défini, au choix, comme

  • un nombre entier pouvant représenter n'importe quel caractère du jeu de caractères de la machine utilisée ;
  • un nombre entier occupant la plus petite cellule de mémoire adressable séparément 6. Sur les machines actuelles les plus répandues cela signifie généralement un octet (8 bits).

Le plus souvent, un char est un entier signé ; un unsigned char est alors un entier non signé. Lorsque les char sont par défaut non signés, la norme ANSI prévoit la possibilité de déclarer des signed char. On notera que la signification d'un char en C, un entier petit, est très différente de celle d'un char en Pascal (dans ce langage, l'ensemble des caractères et celui des nombres sont disjoints). En C, ch étant une variable de type char, rien ne s'oppose à l'écriture de l'expression ch - 'A' + 32 qui est tout à fait homogène, puisque entièrement faite de nombres.

Le caractère « impossible ». Toutes les valeurs qu'il est possible de ranger dans une variable de type char sont en principe des caractères légaux. Or la plupart des programmes qui lisent des caractères doivent être capables de manipuler une valeur supplémentaire, distincte de tous les « vrais » caractères, signifiant « la fin des données ». Pour cette raison, les variables et fonctions qui représentent ou renvoient des caractères sont souvent déclarées int, non char : n'importe quelle valeur appartenant au type int mais n'appartenant pas au type char peut alors servir d'indicateur de fin de données. Par exemple, une telle valeur est définie dans le fichier stdio.h, c'est la constante symbolique EOF.

Les entiers courts et longs. Il est garanti que toute donnée représentable dans le type short est représentable aussi dans le type long 7 (en bref : un long n'est pas plus court qu'un short !), mais la taille exacte des données de ces types n'est pas fixée par la norme du langage. De nos jours on trouve souvent :

  • unsigned short : 16 bits pour représenter un nombre entier compris entre 0 et 65.535
  • short : 16 bits pour représenter un nombre entier compris entre -32.768 et 32.767
  • unsigned long : 32 bits pour représenter un nombre entier entre 0 et 4.294.967.296
  • long : 32 bits pour représenter un entier entre -2.147.483.648 et 2.147.483.647

Le type int. En principe, le type int correspond à la taille d'entier la plus e±cace, c'est-à-dire la plus adaptée à la machine utilisée. Sur certains systèmes et compilateurs int est synonyme de short, sur d'autres il est synonyme de long.

Le type int peut donc poser un problème de portabilité 8 : le même programme, compilé sur deux machines distinctes, peut avoir des comportements différents. D'ou un conseil important : n'utilisez le type int que pour des variables locales destinées à contenir des valeurs raisonnablement petites (inférieures en valeur absolue à 32767) . Dans les autres cas il vaut mieux expliciter char, short ou long selon le besoin.

A propos des booléens. En C il n'existe donc pas de type booléen spécifique. Il faut savoir qu'à tout endroit ou une expression booléenne est requise (typiquement, dans des instructions comme if ou while) on peut faire figurer n'importe quelle expression ; elle sera tenue pour vraie si elle est non nulle, elle sera considérée fausse sinon. Ainsi, dans un contexte conditionnel,

expr

(c'est-à-dire expr « vraie ») équivaut à expr != 0

(expr différente de 0). Inversement, lorsqu'un opérateur (égalité, comparaison, etc.) produit une valeur booléenne, il rend 0 pour faux et 1 pour vrai.

Signalons aux esthètes que le fichier <types.h> comporte les déclarations :

enum { false, true };

typedef unsigned char Boolean;

qui introduisent la constante false valant 0, la constante true valant 1 et le type Boolean comme le type le moins encombrant dans lequel on peut représenter ces deux valeurs.

* 5 On dit parfois qu'une donnée « est un entier signé » ou « est un entier non signé ». C'est un abus de langage : le caractère signé ou non signé n'est pas un attribut d'un nombre (un nombre donné est positif ou négatif, c'est tout) mais de l'ensemble de nombres qu'on a choisi de considérer et, par extension, de toute variable censée pouvoir représenter n'importe quelle valeur de cet ensemble.

* 6A retenir : un objet de type char est « unitaire » aussi bien du point de vue des tailles que de celui des adresses. Quelle que soit la machine utilisée, le compilateur C fera en sorte que le programmeur voie ces objets de la manière suivante : si t est un tableau de char, la taille (au sens de l'opérateur sizeof, cf. section 2.2.11) de t[0] vaut une unité de taille, et l'écart entre les adresses de t[1] et t[0] vaut une unité d'adressage. On peut dire que ces propriétés définissent le type char (ou, si vous préférez, les unités de taille et d'adressage).

* 7Si on considère un type comme l'ensemble de ses valeurs, on a donc les inclusions larges char N short N long (et aussi float N double N long double).

* 8Un programme écrit pour une machine ou un système A est dit portable s'il su±t de le recompiler pour qu'il tourne correctement sur une machine différente B. Par exemple, « putchar('A') ; » est une manière portable d'obtenir

l'a±chage du caractère A, tandis que « putchar(65) ; » est (sur un système utilisant le code ASCII) une manière non portable d'obtenir le même a±chage. Etre portable est un critère de qualité et de fiabilité important. On invoque l'e±cacité pour justifier l'écriture de programmes non portables ; l'expérience prouve que, lorsque son écriture est possible, un programme portable est toujours meilleur qu'un programme non portable prétendu équivalent.

I-D-2 - Types énumérés

Un type énuméré, ou énumération, est constitué par une famille finie de nombres entiers, chacun associé à un identificateur qui en est le nom. Mis à part ce qui touche à la syntaxe de leur déclaration, il n'y a pas grand-chose à dire à leur sujet. La syntaxe de la déclaration des énumérations est expliquée à la section 5.3. Par exemple, l'énoncé :

enum jour_semaine - lundi, mardi, mercredi, jeudi, vendredi, samedi, dimanche }; introduit un type énuméré, appelé enum jour semaine, constitué par les constantes lundi valant 0, mardi valant 1, mercredi valant 2, etc. Ainsi, les expressions mardi + 2 et jeudi représentent la même valeur. Les valeurs d'un type énuméré se comportent comme des constantes entières ; elles font donc double emploi avec celles qu'on définit à l'aide de #define (cf. section 8.1.2). Leur unique avantage réside dans le fait que certains compilateurs détectent parfois, mais ce n'est pas exigé par la norme, les mélanges entre objets de types énumérés distincts ; ces types sont alors le moyen d'augmenter la sécurité des programmes. A propos des types énumérés voyez aussi la section 5.3

I-D-3 - Nombres flottants

La norme ANSI prévoit trois types de nombres flottants : float (simple précision), double (double précision) et long double (précision étendue). La norme ne spécifie pas les caractéristiques de tous ces types. Il est garanti que toute valeur représentable dans le type float est représentable sans perte d'information dans le type double, et toute valeur représentable dans le type double l'est dans le type long double.

Typiquement, sur des systèmes de taille moyenne, un float occupe 32 bits et un double 64, ce qui donne par exemple des float allant de -1.70E38 à -0.29E-38 et de 0.29E-38 à 1.70E38 avec 7 chiffres décimaux significatifs, et des double allant de -0.90E308 à -0.56E-308 et de 0.56E-308 à 0.90E308 avec 15 chiffres décimaux significatifs.

Les long double correspondent généralement aux flottants de grande précision manipulés par certains coprocesseurs arithmétiques ou les bibliothèques de sous-programmes qui les simulent. Mais il n'est pas exclu que sur un système particulier un long double soit la même chose qu'un double.

I-E - Variables

I-E-1 - Syntaxe des déclarations

La forme complète de la déclaration d'une variable sera expliquée à la section 5.4. Dans le cas le plus simple on trouve spécification var-init , var-init , ... var-init ;

ou spécification est de la forme :

et chaque var-init est de la forme :

Exemples :

int x, y = 0, z; extern float a, b;

static unsigned short cpt = 1000;

Les déclarations de variables peuvent se trouver :

  • en dehors de toute fonction, il s'agit alors de variables globales ;
  • à l'intérieur d'un bloc, il s'agit alors de variables locales ;
  • dans l'en-tête d'une fonction, il s'agit alors d'arguments formels, placés
  • soit dans les parenthèses de l'en-tête (fonction définie en syntaxe ANSI avec un prototype),
  • soit entre le nom de la fonction et le f initial (fonction définie en syntaxe originale ou sans prototype). Exemple. Avec prototype :

long i = 1;

int une_fonction(int j) {

short k;

...

}

Sans prototype :

long i = 1;

int une_fonction(j)

int j;

{

short k;

...

}

Ci-dessus, i est une variable globale, k une variable locale et j un argument formel de une fonction

I-E-2 - Visibilité des variables

La question de la visibilité des identificateurs (c'est-à-dire « quels sont les identificateurs auxquels on peut faire référence en un point d'un programme ? ») est réglée en C comme dans la plupart des langages comportant la structure de bloc, avec une simplification : les fonctions ne peuvent pas être imbriquées les unes dans les autres, et une complication : tout bloc peut comporter ses propres définitions de variables locales.

Un bloc est une suite de déclarations et d'instructions encadrée par une accolade ouvrante \f" et l'accolade fermante \g" correspondante. Le corps d'une fonction est lui-même un bloc, mais d'autres blocs peuvent être imbriqués dans celui-là.

VARIABLES LOCALES. Tout bloc peut comporter un ensemble de déclarations de variables, qui sont alors dites locales au bloc en question. Une variable locale ne peut être référencée que depuis l'intérieur du bloc ou elle est définie ; en aucun cas on ne peut y faire référence depuis un point extérieur à ce bloc. Dans le bloc ou il est déclaré, le nom d'une variable locale masque toute variable de même nom définie dans un bloc englobant le bloc en question.

Toutes les déclarations de variables locales à un bloc doivent être écrites au début du bloc, avant la première instruction.

ARGUMENTS FORMEL. Pour ce qui concerne leur visibilité, les arguments formels des fonctions sont considérés comme des variables locales du niveau le plus haut, c'est-à-dire des variables déclarées au début du bloc le plus extérieur 9. Un argument formel est accessible de l'intérieur de la fonction, partout ou une variable locale plus profonde ne le masque pas. En aucun cas on ne peut y faire référence depuis l'extérieur de la fonction.


128