Algorithme débutant

ALGORITHME
u Définition nom masculin (d'Al-Khârezmi, médecin arabe).
Suite de raisonnements ou d'opérations qui fournit la solution de certains problèmes.
u Objectifs
Un algorithme sert à transmettre un savoir faire.
Il décrit les étapes à suivre pour réaliser un travail.
Il permet d'expliciter clairement les idées de solution d'un problème indépendamment d'un langage de programmation.
L'utilisateur d'un algorithme n'aura qu'à suivre toutes les instructions, dans l'ordre pour arriver au résultat 1 que doit donner l'algorithme.
u Le "langage algorithmique" que nous utilisons est un compromis entre un langage naturel et un langage de programmation.
u Nous présentons les algorithmes comme une suite d'instructions dans l'ordre des traitements. Ils sont toujours accompagnés d'un lexique qui indique, pour chaque variable, son type et son rôle.
u Nous manipulerons les types couramment rencontrés dans les langages de programmation : entier, réel, 2 booléen, caractère, chaîne, tableau et type composite.
Formalisme
u Un algorithme doit être lisible et compréhensible par plusieurs personnes.
u Il doit donc suivre des règles. Il est composé d'une entête et d'un corps.
u L'entête comprend :
- Nom : le nom de l'algorithme
- Rôle : ce que fait l'algorithme
- Données : les données fournies à l'algorithme
- Résultat : ce que l'on obtient à la fin du traitement
- Principe : le principe utilisé dans l'algorithme
u Le corps : 3
- il est délimité par les mots clés début et fin.
- il se termine par un lexique, décrivant les variables utilisées
u Par convention, tous les identifiants de variables seront notés en minuscule et auront un nom mnémonique
u Il en va de même pour les fonctions, dont l'identifiant doit être le plus explicite sur son rôle. Ce dernier peut être une contraction de plusieurs mots, par
conséquent pour rendre la lecture plus facile, la première lettre de chaque mot est mis en majuscule (exemple : CalculerAireRectangle).
4
u Exemple d'algorithme :
Nom:AddDeuxEntiers.
Rôle : additionner deux entier et mémoriser le résultat Données : les valeurs à additionner.
Résultat : la somme des deux valeurs.
Principe:Additionner deux entiers a et b et mettre le résultat dans c.
début c ? a + b
fin Lexique :5 a : entier b : entier c : entier
u Une variable est une entité qui contient une information, elle possède :
u un nom, on parle d’identifiant
u une valeur
u un type qui caractérise l’ensemble des valeurs que peut prendre la variable
u L’ensemble des variables est stocké dans la mémoire de l’ordinateur
6
u Type de variable
u entier pour manipuler des entiers
u réel pour manipuler des nombres réels
u booléen pour manipuler des valeurs booléennes
u caractère pour manipuler des caractères alphabétiques et numériques
u chaîne pour manipuler des chaînes de caractères permettant de représenter des mots ou des phrases. 7
u A un type donné, correspond un ensemble d'opérations définies pour ce type.
u Une variable est l'association d'un nom avec un type, permettant de mémoriser une valeur de ce type.
8
Opérateur, opérande et expression
u Un opérateur est un symbole d’opération qui permet d’agir sur des variables ou de faire des “calculs”
u Une opérande est une entité (variable, constante ou expression) utilisée par un opérateur
u Une expression est une combinaison d’opérateur(s) et d’opérande(s), elle est évaluée durant l’exécution de l’algorithme, et possède une valeur (son interprétation) et un type
9
Opérateur, opérande et expression
Exemple dans a + b :
a est l’opérande gauche + est l’opérateur b est l’opérande droite a + b est appelé une expression
Si par exemple a vaut 2 et b 3, l’expression a + b vaut 5
Si par exemple a et b sont des entiers, l’expression a + b est un entier
Les opérateurs
u Un opérateur peut être unaire ou binaire :
u Unaire s’il n’admet qu’une seule opérande, par exemple l’opérateur non
u Binaire s’il admet deux opérandes, par exemple l’opérateur +
u Un opérateur est associé à un type de donnée et ne peut être utilisé qu’avec des variables, des constantes, ou des expressions de ce type
types arithmétiques (naturel, entier et réel) ou (exclusif) le 11 u Par exemple l’opérateur + ne peut être utilisé qu’avec les type chaîne de caractères
Les opérateurs
uOn ne peut pas additionner un entier et un caractère
u Toutefois exceptionnellement dans certains cas on accepte d’utiliser un opérateur avec deux opérandes de types différents, c’est par exemple le cas avec les types arithmétiques (2 + 3.5)
u La signification d’un opérateur peut changer en fonction du type des opérandes
u l’opérateur + avec des entiers aura pour sens l’addition, 2+3 vaut 5
u avec des chaînes de caractères il aura pour sens la
concaténation "bonjour" + " tout le monde" vaut 12
"bonjour tout le monde"
Les opérateurs booléens
u Pour les booléens nous avons les opérateurs non, et, ou, ouExclusif
u Non
u Et
13
Les opérateurs booléens
u Ou
u Ou exclusif
14
Les opérateurs booléens
u Rappels sur la logique booléenne...
Valeurs possibles : Vrai ou Faux
u Associativité des opérateurs et et ou a et (b et c) = (a et b) et c
u Commutativité des opérateurs et et ou
a et b = b et a a ou b = b ou a
Les opérateurs booléens
u Distributivité des opérateurs et et ou a ou (b et c) = (a ou b) et (a ou c) a et (b ou c) = (a et b) ou (a et c)
u Involution (homographie réciproque)
(homos semblable et graphein écrire) non non a = a
u Loi de Morgan
non (a ou b) = non a et non b
non (a et b) = non a ou non b 16
Les opérateurs sur les numériques
u On retrouve tout naturellemment +, -, *, /
u Avec en plus pour les entiers div et mod, qui permettent respectivement de calculer une division entière et le reste de cette division,
par exemple : 11 div 2 vaut 5
11 mod 2 vaut 1
17
Les opérateurs sur les numériques
u L’opérateur d’égalité :
C’est l’opérateur que l’on retrouve chez tous les types simples qui permet de savoir si les deux opérandes sont égales
Il est représenté par le caractère =
Le résultat d'une expression contenant cet opérateur est un booléen
u On a aussi l’opérateur d’inégalité : ?
u Et pour les types possédant un ordre les opérateurs de
comparaison 18
<, ?, >, ?
Priorités des opérateurs
u Tout comme en arithmétique les opérateurs ont des priorités
Par exemple * et / sont prioritaires sur + et -
Pour les booléens, la priorité des opérateurs est non, et, ouExclusif et ou
u Pour clarifier les choses (ou pour dans certains cas supprimer toutes ambiguïtés) on peut utiliser des parenthèses
19
Manipulation de variables
u On ne peut faire que deux choses avec une variable :
1. Obtenir son contenu
Cela s’effectue simplement en nommant la variable
2. Affecter un (nouveau) contenu
Cela s’effectue en utilisant l’opérateur d’affectation représenter par le symbole ?
La syntaxe de cet opérateur est :
identifiant de la variable ? expression
20
Manipulation de variables
u Par exemple l’expression c ? a + b se comprend de la façon suivante :
On prend la valeur contenue dans la variable a
On prend la valeur contenue dans la variable b
On additionne ces deux valeurs
On met ce résultat dans la variable c
u Si c avait auparavant une valeur, cette dernière est perdue !
21
u Un algorithme peut avoir des interactions avec l’utilisateur
u Il peut afficher un résultat (du texte ou le contenu d’une variable)
u demander à l’utilisateur de saisir une information afin de la stocker dans une variable
u En tant qu’informaticien on raisonne en se mettant “à la place de la machine”, donc :
22
Les entrées / sorties
u Instruction d'écriture
L'instruction de restitution de résultats sur le périphérique de sortie (en général l'écran) est :
écrire(liste d'expressions)
Cette instruction réalise simplement l'affichage des valeurs des expressions décrites dans la liste.
Ces instructions peuvent être simplement des variables ayant des valeurs ou même des nombres ou des commentaires écrits sous forme de chaînes de caractères.
u Exemple d'utilisation : écrire(x, y+2, "bonjour") 23
u Instructions de lecture
L'instruction de prise de données sur le périphérique d'entrée (en général le clavier) est :
variable
L'exécution de cette instruction consiste à affecter une valeur à la variable en prenant cette valeur sur le périphérique d'entrée.
Avant l'exécution de cette instruction, la variable avait ou n'avait pas de valeur. Après, elle a la valeur prise sur le 24 périphérique d'entrée.
Les entrées / sorties
u Exemple
On désire écrire un algorithme qui lit sur l'entrée standard une valeur représentant une somme d'argent et qui calcule et affiche le nombre de billets de 100 Euros, 50 Euros et 10 Euros, et de pièces de 2 Euros et 1 Euro qu'elle représente.
Nom : DécompSomme.
Rôle : Décomposition d'une somme Données : la somme à décomposée.
Résultat : les nombres de billets et de pièces.
Principe : on commence par lire sur l'entrée standard l'entier qui représente la somme d'argent et affecte la valeur à
une variable somme.
Pour obtenir la décomposition en nombre de billets 25 et de pièces de la somme d'argent, on procède par divisions successives en conservant chaque fois le reste.
début
somme
reste2
piece1
écrire (billet100, billet50, billet10, piece2, piece1) fin
Les entrées / sorties
u Lexique
- somme : entier, la somme d'argent à décomposer
- billet100 : entier, le nombre de billets de 100 Euros
- billet50 : entier, le nombre de billets de 50 Euros
- billet10 : entier, le nombre de billets de 10 Euros
- piece2 : entier, le nombre de pièces de 2 Euros
- piece1 : entier, le nombre de pièces de 1 Euro - reste100 : entier, reste de la division entière de somme par 100
- reste50 : entier, reste de la division entière de reste100 par 50
- reste10 : entier, reste de la division entière de reste50 27 par 10
- reste2 : entier, reste de la division entière de reste10 par 2
Instruction conditionnelle
u L’instruction si alors sinon permet de conditionner l’exécution d’un algorithme à la valeur d’une expression booléenne. Syntaxe :
siexpression booléennealors
suite d’instructions exécutées si l’expression est vrai sinon
suite d’instructions exécutées si l’expression est fausse finsi
28
Instruction conditionnelle
u La deuxième partie de l’instruction est optionnelle, on peut avoir la syntaxe suivante :
siexpression booléennealors suite d’instructions exécutées si l’expression est vrai finsi
29
Instruction conditionnelle
u Exemple
Nom : ValeurAbs
Rôle : Calcule la valeur absolue d’un entier
Données : La valeur à calculer
Résultat : La valeur Absolue
Principe : Si valeur < 0, on la multiplie par -1 début
si valeur ? 0 alors
valeurabsolue ? valeur sinon
valeurabsolue ? valeur * -1
finsi
fin
Lexique
- valeur : entier, la valeur à tester
- valeurabsolue : la valeur absolue
L'instruction cas
u Lorsque l’on doit comparer une même variable avec plusieurs valeurs, comme par exemple : si a=1 alors faire une chose sinon si a=2 alors
faire une autre chose
sinon si a=4 alors faire une autre chose sinon . . . finsi
finsi 31 finsi
u On peut remplacer cette suite de si par l’instruction cas
L'instruction cas
u Sa syntaxe est : cas où v vaut v1 : action1 v2 : action2 . . .
vn : actionn autre : action autre
fincas
v1,. . . ,vn sont des constantes de type scalaire (entier, naturel, enuméré, ou caractère) action i est exécutée si v = vi (on quitte ensuite l’instruction cas)
action autre est exécutée si quelque soit i, v ? vi
Les itérations
u Il arrive souvent dans un algorithme qu'une même action soit répétée plusieurs fois, avec éventuellement quelques variantes. Il est alors fastidieux d'écrire un algorithme qui contient de nombreuses fois la même instruction. De plus, ce nombre peut dépendre du déroulement de l'algorithme.
Il est alors impossible de savoir à l'avance combien de fois la même instruction doit être décrite.
Pour gérer ces cas, on fait appel à des instructions en boucle qui ont pour effet de répéter plusieurs fois une même instruction.
Deux formes existent : la première, si le nombre de répétitions est connu avant l'exécution de l'instruction de répétition, la seconde s'il n'est pas connu. L'exécution de la liste des instructions se nomme itération.
33
Répétitions inconditionnelles
u Il est fréquent que le nombre de répétitions soit connu à l'avance, et que l'on ait besoin d'utiliser le numéro de l'itération
afin d'effectuer des calculs ou des tests. Le mécanisme permettant cela est la boucle Pour.
u Forme de la boucle Pour :
Pour variable de valeur initiale à valeur finale faire liste d'instructions fpour
34
Répétitions inconditionnelles
u La variable dont on donne le nom va prendre successivement toutes les valeurs entières entre valeur initiale et valeur finale. Pour chaque valeur prise par la variable, la liste des instructions est exécutée.
u La valeur utilisée pour énumérer les itérations est appelée valeur d'itération, indice d'itération ou compteur. L'incrémentation par 1 de la variable est implicite.
35
Répétitions inconditionnelles
u Autre forme de la boucle Pour :
Pour variable décroissante de valeur initiale à valeur finale faire
liste d'instructions
fpour
La variable d'itération est décrémentée de 1 après chaque itération.
36
Les répétitions conditionnelles
u L'utilisation d'une "boucle pour" nécessite de connaître à l'avance le nombre d'itérations désiré, c'est-à-dire la valeur finale du compteur. Dans beaucoup de cas, on souhaite répéter une instruction tant qu'une certaine condition est remplie, alors qu'il est à priori impossible de savoir à l'avance au bout de combien d'itérations cette condition cessera d'être satisfaite. Dans ce cas, on a deux possibilités :
- la boucle Tant que
- la boucle Répéter jusqu'à
u Syntaxe de la boucle Tant que :
tant que condition faire
liste d'instructions 37 ftant
Les répétitions conditionnelles
u Cette instruction a une condition de poursuite dont la valeur est de type booléen et une liste d'instructions qui est répétée si la valeur de la condition de poursuite est vraie : la liste d'instructions est répétée autant de fois que la condition de poursuite a la valeur vraie. Le déroulement pas à pas de cette
instruction
équivaut à :
si condition
alors liste d'instructions
si condition
alors liste d'instructions
si condition 38
alors liste d'instructions
...
Les répétitions conditionnelles
u Etant donné que la condition est évaluée avant l'exécution des instructions à répéter, il est possible que celles-ci ne soient jamais exécutées.
u Il faut que la liste des instructions ait une incidence sur la condition afin qu'elle puisse être évaluée à faux et que la boucle se termine.
u Il faut toujours s'assurer que la condition devient fausse au bout d'un temps fini.
u Exemple 39
Un utilisateur peut construire des rectangles de taille quelconque, à condition que les largeurs qu'il saisit soient supérieures à 1 pixel.
Les répétitions conditionnelles
Nom : saisirLargeurRectangle
Rôle : Vérification validité largeur saisie Données : La largeur Résultat :
Principe : Tant que la largeur est < 1, on demande de resaisir la largeur
début
écrire ("indiquez la largeur du rectangle :")
largeur
écrire ("erreur : indiquez une valeur strictement positive") écrire ("indiquez la largeur du rectangle :") largeur
fin 40
Lexique
- largeur : entier, largeur courante saisie
Les répétitions conditionnelles
u Syntaxe de la boucle Répéter jusqu'à : Répéter
liste d'instructions
jusqu'à condition
La séquence d'instructions est exécutée au moins une fois et jusqu'à ce que l'expression soit vraie. Dès que la condition est vrai, la répétitivité s'arrête.
41
Les répétitions conditionnelles
Nom : saisirLargeurRectangle
Rôle : Vérification validité largeur saisie Données : La largeur Résultat :
Principe : Tant que la largeur est < 1, on demande de resaisir la largeur
début
Répéter
écrire ("indiquez la largeur du rectangle :") largeur
écrire ("erreur : indiquez une valeur strictement positive") fin si jusqu'à largeur >= 1 fin 42
Lexique
- largeur : entier, largeur courante saisie
Les répétitions conditionnelles
u Différences entre les boucles Tant que et Répéter jusqu'à :
- la séquence d'instructions est exécuter au moins une fois dans la boucle Répéter jusqu'à, alors qu'elle peut ne pas être exécuter dans le cas du Tant que.
- la séquence d'instructions est exécuter si la condition est vrai pour le Tant que et si la condition est fausse pour le Répéter jusqu'à.
- Dans les deux cas, la séquence d'instructions doit 43 nécessairement faire évoluer la condition, faute de quoi on obtient une boucle infinie.
Les tableaux
u Lorsque les données sont nombreuses et de même type, afin d'éviter de multiplier le nombre des variables, on les regroupe dans un tableau
u Le type d'un tableau précise le type (commun) de tous les éléments.
u Syntaxe :
tableau type_des_éléments[borne_inf ... borne_sup]
u En général, nous choisirons toujours la valeur 0 pour la borne inférieure dans le but de faciliter la traduction de
l'algorithme vers les autres langages (C, Java, ...). Pour un
tableau de 10 entiers, on aura : 44 tab : tableau entier[0..9]
Les tableaux
u Les tableaux à une dimension ou vecteurs
0 1 2 3 4 5 6 7 8 9
45 54 1 -56 22 134 49 12 90 -26
u Ce tableau est de longueur 10, car il contient 10 emplacements.
u Chacun des dix nombres du tableau est repéré par son rang, appelé indice
u Pour accéder à un élément du tableau, il suffit de préciser entre crochets l'indice de la case contenant cet élément.
Pour accéder au 5ème élément (22), on écrit : Tab[4] 45
Les tableaux
u Les instructions de lecture, écriture et affectation s'appliquent aux tableaux comme aux variables.
x ? Tab[0]
La variable x prend la valeur du premier élément du tableau, c'est à dire : 45
Tab[6] ? 43
Cette instruction a modifiée le contenu du tableau 46
Les tableaux
u Parcours complet d'un tableau
La plupart des algorithmes basés sur les tableaux utilisent des itérations permettant de faire un parcours complet ou partiel des différents éléments du tableau. De tels algorithmes établissent le résultat recherché par récurrence en fonction des éléments successivement rencontrés.
Les répétitions inconditionnelles sont le moyen le plus simple de parcourir complètement un tableau.
47
Les tableaux
Dans l'exemple suivant, le programme initialise un à un tous les éléments d'un tableau de n éléments :
InitTableau
début
pour i de 0 à n-1 faire tab[i] ? 0 fpour fin
Lexique :
- i : entier, indice d'itération
- n : entier, taille du tableau 48
- tab : tableau entier[0..n-1]
Les tableaux
u Les tableaux à deux dimensions ou matrices
Lorsque les données sont nombreuses et de même nature, mais dépendent de deux critères différents, elles sont rangées dans un tableau à deux entrées.
0 1 2 3 4 5 6
0 12 28 44 2 76 77 32
1 23 36 51 11 38 54 25
2 43 21 55 67 83 41 69
Ce tableau a 3 lignes et 7 colonnes. Les éléments du tableau sont repérés par leur numéro de ligne et leur numéro de
colonne. 49
Tab[1, 4] = 38
Les tableaux
u La variable T[L, C] s'appelle l'élément d'indice L et C du tableau T.
T[0, 0] T[0, 1] T[0, 2] T[0, 3] T[0, 4]
u Les tableaux peuvent avoir n dimensions. |
50 |
T[1, 0] T[1, 1] T[1, 2] T[1, 3] T[1, 4]
T[2, 0] T[2, 1] T[2, 2] T[2, 3] T[2, 4]
Tableau T à 3 lignes et 5 colonnes.
Les procédures et les fonctions
u La méthodologie de base de l’informatique est :
1. Abstraire
Retarder le plus longtemps possible l’instant du codage
2. Décomposer
"...diviser chacune des difficultés que j’examinerai en autant de parties qu’il se pourrait et qu’il serait requis pour les mieux résoudre." Descartes
3. Combiner
Résoudre le problème par combinaison d’abstractions 51
Les procédures et les fonctions
u Par exemple, résoudre le problème suivant :
Ecrire un programme qui affiche en ordre croissant les notes
d’une promotion suivies de la note la plus faible, de la note la plus élevée et de la moyenne, revient à résoudre les problèmes suivants :
- Remplir un tableau de naturels avec des notes saisies par l’utilisateur
- Afficher un tableau de naturels
- Trier un tableau de naturel en ordre croissant
- Trouver le plus petit naturel d’un tableau
- Trouver le plus grand naturel d’un tableau
- Calculer la moyenne d’un tableau de naturels
Les procédures et les fonctions
Chacun de ces sous-problèmes devient un nouveau problème à résoudre.
Si on considère que l’on sait résoudre ces sousproblèmes, alors on sait “quasiment” résoudre le problème initial.
Donc écrire un programme qui résout un problème revient toujours à écrire des sous-programmes qui résolvent des sous parties du problème initial.
En algorithmique il existe deux types de sousprogrammes :
- Les fonctions 53
- Les procédures
Les fonctions récursives
u Une fonction récursive est une fonction qui pour fournir un résultat, s’appelle elle-même un certain nombre de fois.
u Exemple : la formule de calcul de la factorielle d’un nombre n s’écrit :
n ! = 1 x 2 x 3 x … x n
Ce qui peut se programmer avec une boucle Pour.
54
Les fonctions récursives
Une autre manière de voir les choses, serait de dire que :
n ! = n x (n-1) !
D’où, la factorielle d’un nombre, c’est ce nombre multiplié par la factorielle du nombre précédent.
u Pour programmer cela, il faut une fonction Facto, chargée de calculer la factorielle. Cette fonction effectue la multiplication du nombre passé en argument par la factorielle du nombre précédent.
Et cette factorielle du nombre précédent va bien entendu être 55 elle-même calculée par la fonction Fact.
Les fonctions récursives
u Pour terminer, il nous manque la condition d'arrêt de ces auto-appels de la fonction Facto.
Dans le cas d'un calcul de factorielle, on s’arrête quand on arrive au nombre 1, pour lequel la factorielle est par définition 1.
Fonction Facto (n : Entier)
Début
Si n = 1 alors
Renvoyer 1
Sinon
Renvoyer Facto(n - 1) * n Finsi 56
Fin
Les fonctions récursives
u Le processus récursif remplace en quelque sorte la boucle, c’est-à-dire un processus itératif.
u Il est à noter que l'on traite le problème à l’envers : on part du nombre, et on remonte à rebours jusqu’à 1, pour pouvoir calculer la factorielle.
u Cet effet de rebours est caractéristique de la programmation récursive.
57
Les fonctions récursives
u Pour conclure sur la récursivité, trois remarques fondamentales.
- la programmation récursive, pour traiter certains problèmes, peut être très économique, elle permet de faire les choses correctement, en très peu de lignes de programmation.
- en revanche, elle est très dispendieuse de ressources machine. Car il faut créer autant de variable temporaires que de " tours " de fonction en attente.
- toute fonction récursives peut également être formulée 58 en termes itératifs ! Donc, si elles facilitent la vie du programmeur, elle ne sont pas indispensable.
u Les algorithmes de tri, sont utilisés principalement pour les tableaux et les listes, ils peuvent aller du plus simple au plus compliquer.
u Le tri à bulle
C’est un des algorithmes le plus connu. Bien qu’il soit rarement efficace en terme de temps de calcul, il est néanmoins correcte.
Le principe consiste à balayer tout le tableau, en comparant les éléments adjacents et en les échangeant 59 s’ils ne sont pas dans le bon ordre.
Un seul passage ne déplacera un élément donné que d’une position, mais en répétant le processus jusqu’à ce que plus aucun échange ne soit nécessaire, le tri sera effectué.
Ce tri va nécessiter un grand nombre de déplacements d’éléments, il est donc inutilisable dans les cas où ces déplacements sont coûteux en temps.
Il peut par contre être intéressant quand le tableau initial est pré-trié, les éléments n’étant pas disposés trop loin de leur position finale, par exemple lors d’un classement alphabétique, où les éléments sont déjà triés par leur 60 première lettre.
u Le tri par insertion
Plutôt que de déplacer les éléments d’une position, on peut prendre un élément après l’autre dans l’ordre initial, et le placer correctement dans les éléments précédents déjà triés, comme on le fait lorsque l’on classe ses carte à jouer après la donne.
Le tri par insertion peut être intéressant pour des tableaux ayant déjà été triés, mais où l’on doit rajouter quelques nouveaux éléments.
u Le tri par sélection
Le but est désormais de déplacer chaque élément à sa position définitive.
On recherche l’élément le plus petit. Il faut donc le placer en premier, or cette position est déjà occupée, on échange donc les deux éléments.
Il ne reste plus qu’à répéter l’opération N fois.
Chaque échange met un élément en position définitive, l’autre par contre est mal placé. Cependant, aucun échange n’est inutile, car un élément qui a été bien placé, 62 ne sera plus testé par la suite.
u Le tri shell
C’est une amélioration du tri par insertion, au lieu d’effectuer une rotation de tous les éléments entre la position initiale et finale d’un élément, on peut faire des rotation par pas de P, ce qui rendra le fichier presque trié.
Chaque élément sera à moins de P positions de sa position exacte.
On répète ce tri pour P diminuant jusqu’à 1.
Une suite possible pour P est de finir par 1, les pas 63 précédents étant de 4, 13, 40, 121, 364, 1093.
D’autres suites sont possibles, à condition de prendre des valeurs qui ne soient pas multiples entre elles, pour ne pas toujours traiter les mêmes éléments et laisser de côté les autres.
Les puissances successives de 2 ne traiteraient que les positions paires, sauf au dernier passage.
L’intérêt de ce tri, est qu’il créé rapidement un fichier presque trié, en appliquant un dernier par insertion, celuici sera beaucoup plus rapide.
64 u Le tri rapide (Quick Sort)
Ce tri est récursif. On cherche à trier une partie du tableau, délimitée par les indices gauche et droite.
On choisit une valeur de ce sous tableau que l’on appelle pivot (une valeur médiane serait idéale, mais sa recherche ralentit plus le tri que de prendre une valeur aléatoire).
Puis on cherche la position définitive de ce pivot, c’est-àdire que l’on effectue des déplacements de valeurs de telle sorte que tous les éléments avant le pivot soient plus petit que lui et que tous ceux placés après lui soient supérieurs, mais sans chercher à les classer, pour accélérer le 65 processus.
Puis on rappelle récursivement le tri de la partie avant le pivot et celle de la partie après le pivot.
On arrête la récursivité sur les parties à un seul élément, dans ce cas, le tri à obligatoirement été effectué.
u Le tri par création
Lorsqu’il est nécessaire de disposer simultanément du tableau initial et du tableau trié, on peut recopier le tableau initial puis effectuer un tri sur la copie ou adapter 66 un des algorithmes précédents.
u Les autres tris
Suivant les données à trier, il peut être plus efficace de construire un algorithme de tri spécifique.
Par exemple si un tableau contient un grand nombre de valeurs similaires, on peut utiliser un algorithme simple, consistant à rechercher l’élément le plus petit, compter le nombre de ces éléments, les mettre dans un tableau destination, et répéter l’opération jusqu’à la fin du fichier. C’est le tri par comptage.
Le tri par fusion utilise un algorithme de fusion de deux tableaux triés en un seul plus grand, appelé récursivement sur les deux moitiés du tableau, jusqu’à une taille de 67 tableau de 1.
Les algorithmes de recherche
u La recherche séquentielle
A partir d’un tableau trié, on parcours ce tableau élément par élément jusqu’à trouver le bon élément.
u La recherche dichotomique
La recherche dichotomique recherche un élément dans un tableau trié et retourne l’indice d’une occurrence de cet élément.
On compare l’élément cherché à celui qui se trouve au milieu du tableau. Si l’élément cherché est plus petit, on continu la recherche dans la première moitié du tableau, sinon dans la seconde moitié.
On recommence ce processus sur la moitié. On s’arrête lorsque l’on a trouvé l’élément, ou lorsque l’intervalle de 68 recherche est nul.
Les structures de données dynamiques
u Jusqu'ici, on a étudié des structures de données statiques, c'est-à-dire qui ont un nombre fixe d'informations, utilisées pour la représentation de données dont la taille est connue à l'avance et n'évolue pas dans le temps.
u Dans la pratique, il arrive souvent que l'on ait besoin de représenter des objets dont on ne connaît pas à priori la taille, ou dont la taille est variable selon les cas ou au cours du temps.
u On utilise dans ce cas des structures de données dynamiques qui peuvent évoluer pour s'adapter à la
représentation des ces objets. 69
Les structures de données dynamiques
u Exemple : On doit lire dans un fichier une suite de nombres sur lesquels on doit effectuer un traitement ultérieur. On ne connaît pas la quantité de nombres à lire et on ne veut pas les compter avant.
u La première solution consiste à utiliser un tableau surdimensionner, au risque qu'il soit trop petit ou réellement trop grand, ce qui induit une occupation mémoire inutile.
u L'autre solution consiste à utiliser une structure dynamique qui s'agrandit au fur et à mesure de la lecture des nombres. 70
Les structures de données dynamiques
u Le principe de base est de suivre les évolution de la structure en lui attribuant de la place en mémoire quand elle grandit et en la récupérant quand elle diminue
u Ceci est réalisé par un mécanisme d'allocation et de libération dynamique d'espace mémoire qui utilise une zone mémoire particulière appelée TAS (HEAP) dans laquelle on réserve des emplacements quand c'est nécessaire, Que l'on libère quand on en a plus besoin.
u On dispose de deux procédures standard d'acquisition et de libération de l'espace mémoire :RESERVE et LIBERE
71
Les pointeurs
u Les procédures RESERVE et LIBERE travaillent exclusivement avec des pointeurs.
Pointeur Pointeur contient l'adresse de début d'enregistrement |
Dupont 28 435 |
72 |
u Une variable de type pointeur est une variable dont le contenu est une adresse qui peut indiquer l'emplacement en mémoire d'une autre variable, créée dynamiquement et ayant un type de base précis.
u Quand une variable pointeur ne pointe sur rien, elle doit contenir la valeur NULL.
Structure autoréférentielle
u Une structure autoréférentielle (ou structure récursive) correspond à une structure dont au moins un des champs contient un pointeur vers une structure de même type.
u De cette manière, on crée des éléments (appelés nœud ou lien) contenant des données, mais contrairement à un tableau, celleci peuvent être éparpillées en mémoire et reliées entre-elles par des liens logiques (des pointeurs).
u Un ou plusieurs champs dans chaque structure contient l'adresse d'une ou de plusieurs structures de même type.
73
Structure autoréférentielle
u Si une structure contient des données et un pointeur vers la structure suivante, on parle de liste chaînée.
u Lorsque la structure contient des données, un pointeur vers la structure suivante et un pointeur vers la structure précédente, on parle de liste chaînée double.
u Lorsque la structure contient des données, un pointeur vers une première structure suivante et un pointeur vers une seconde, on parle d'arbre binaire.
74
Les listes chaînées
u Une liste chaînée est une structure de données dans laquelle les éléments sont rangés linéairement. Chaque élément est lié à son successeur, il est donc impossible d'accéder directement à un élément quelconque de la liste
12 ? 25 ? 4 ? 7 /
u Bien évidement, cette linéarité est purement virtuelle. A la différence du tableau, les éléments n'ont aucune raison d'être contigus ni ordonnés en mémoire.
25 12 7 / 4
75
Les listes chaînées
u La façon dont on met en œuvre ces structures dépend des langages, même si la façon dont cela est représenté ici ressemble fortement à celle du langage C.
u Une méthode simple pour se représenter une liste, consiste à se dire
- qu'une liste L est soit vide, soit elle est constituée - d'une tête T (qui est donc la valeur du premier élément de la liste) et
- d'une queue Q (qui est le reste de la liste).
76
Les listes chaînées
u En terme de pointeurs et de structures, une liste peut se représenter grâce au type suivant :
Structure Maillon Entier valeur
? Maillon suivant
77
Les listes chaînées
u L'exemple précédent peut se définir par
Maillon cell1, cell2, cell3, cell4
Début
cell1.valeur ? 12 cell1.suivant ? #cell2 cell2.valeur ? 25 cell2.suivant ? #cell3 cell3.valeur ? 4 cell3.suivant ? #cell4
cell4.valeur ? 7
cell4.suivant ? NULL 78
Fin
Les listes doublement chaînées
u Une liste doublement chaînée est une liste chaînée, à ceci près que l'on peut accéder à son prédécesseur.
? ? ?
/ 12 25 4 7 /
? ? ?
u Bien sûr, cette linéarité est purement virtuelle. Tout comme pour les listes chaînées simples, les éléments n'ont aucune raison d'être contigus ni ordonnés en mémoire.
25 / 12 7 / 4
79
Les listes doublement chaînées
u En terme de pointeurs et de structures, on peut définir ce type de la façon suivante :
Structure Maillon Entier valeur
? Maillon suivant
? Maillon precedent
80
Les listes doublement chaînées
Maillon cell1, cell2, cell3, cell4
Début
cell1.valeur ? 12 cell1.suivant ? #cell2 cell1.precedent ? NULL cell2.valeur ? 25 cell2.suivant ? #cell3 cell2.precedent ? #cell1 cell3.valeur ? 4 cell3.suivant ? #cell4
cell3.precedent ? #cell2
cell4.valeur ? 7 81 cell4.suivant ? NULL cell4.precedent ? #cell3
Fin
Les listes
u Elles ont l'avantage d'être réellement dynamiques, c'est dire que l'on peut à loisir les rallonger ou les raccourcir, avec pour seule limite la mémoire disponible.
u De plus, l'insertion d'un composant au milieu d'une liste ne nécessite que la modification des liens avec l'élément précédent et le suivant. Le temps nécessaire pour l'opération sera donc indépendant de la longueur de la liste.
82
Les piles et les files
u Ce sont des structures de données ordonnées, mais qui ne permettent l'accès qu'à une seule donnée.
u Les piles (LIFO : Last In First Out) correspondent à une pile d'assiettes : on prend toujours l'élément supérieur, le dernier emplilé.
u Les files (FIFO : First In First Out) correspondent aux files d'attente : on prend toujours le premier élément, donc le plus ancien.
u Elles sont très souvent utiles, elles servent à mémoriser des 83 évènements en attente de traitement.
u Il n'y a pas de structures spécifiques prévues dans les langages de programmation, il faut donc les créer de toute pièce.
u Pour les piles, on utilisera :
- un tableau unidimensionnel en cas de piles de hauteur maximale prévisible (la hauteur de la pile est mémorisée dans une variable entière).
- une liste en cas de longueur très variable. Attention au surcoût de mémoire, dû aux liens (pointeurs), il 84 faudra en créer autant que d'éléments empiler.
u Pour les files :
- l'utilisation d'un tableau nécessite de mémoriser deux variables, la position du premier élément et celle du dernier. La suppression du premier élément ne se fait pas par décalage des suivants, mais en incrémentant la variable indiquant le premier. La gestion est alors un peu plus complexe que pour les piles.
- l'utilisation d'une liste pour les files est aussi simple
que pour une pile. 85 u Les fonctions de base
u Pour les piles
- l'empilage
- le dépilage
u Pour les files
- l'enfilage
- le défilage
u Dans les deux cas on prévoira également une fonction d'initialisation et une fonction indiquant si la pile ou la file est vide.
Seules ces deux fonctions dépendent de la méthode de 86 mise en œuvre (tableau ou liste).
Structure Pile
Entier sommet
Réel tableau
Booléen Pile_Vide(Pile P)
Début
Retourner(P.sommet = -1) // test si pile vide
Fin
Empiler(Pile P, Réel x)
Début
P.sommet ? P.sommet +1 87
P.tableau[P.sommet] ? x
Fin
Réel Dépiler(Pile P)
Début
Si Pile_Vide(P) Alors
Ecrire("Pile vide!") Sinon
P.sommet ? P.sommet -1
Retourner P.tableau[P.sommet + 1]
Fin
88
u Les listes sont des structures dynamiques unidimensionnelles. Les arbres sont leur généralisation multidimensionnelle.
u Une liste est un arbre dont chaque élément a un et un seul fils.
u Chaque composante d'un arbre contient une valeur et des liens vers ses fils.
u Définition :
Un arbre est formé d’un élément de type arbre appelé racine et d’un nombre fini d’arbres appelés sous-arbres.
Un élément quelconque peut avoir plusieurs successeurs, 89 mais un seul prédécesseur. Seul le premier élément n’a pas de prédécesseur.
u Terminologie
- Les éléments
- Un sommet ou nœud est un élément quelconque d’un arbre. - La racine est l’unique sommet n’ayant pas de prédécesseur.
- Une feuille ou nœud terminal est un élément n’ayant pas de successeur.
- Le prédécesseur unique d’un nœud est appelé le père.
- Les successeurs d’un nœud sont appelés les fils.
- Les nœuds qui ont le même père sont appelés frères.
- Le frère placé le plus à gauche est l’aîné.
- Les chemins 90
- Un arc est un chemin reliant deux nœuds
- Une branche est un chemin reliant la racine à une feuille.
u Qualification des arbres
- Horizontale
- Un arbre est dit n-aires, lorsque le nombre maximum de fils d’un même nœud est n.
- Un niveau est défini par un ensemble de nœuds disposés à égale distance de la racine. Le niveau d’un arbre n-aire est qualifié de saturé si tous ses nœuds ont exactement n fils.
- Le prédécesseur unique d’un nœud est appelé le père.
- Un arbre n-aire est complet au sens strict, si tout niveau commencé est saturé.
- Verticale
- La hauteur d’un arbre binaire est le nombre de nœuds qui constituent la plus longue branche de la racine une feuille.
- Un arbre constitué de seulement une racine a une hauteur de 1.
- S’il est constitué d’une racine et d’une feuille sa hauteur est de 2.
92
1 racine
33 35 nœud
2 4 6 2 8 feuille
1293
Arbre ternaire incomplet de hauteur 4
8 père
33 35 frères 65 66 62 63 fils
Arbre binaire strictement complet de hauteur 3 94
u Comme pour le premier d'une liste, l'adresse de la racine est nécessaire et suffisante pour accéder à l'intégralité d'un arbre.
u Une liste est un arbre unaire.
u Tout arbre peut être représenté par un arbre binaire
95
u De nombreux algorithmes ont été développés pour les arbres binaires.
u Comme les listes les arbres sont complètement dynamiques, mais les liens (pointeurs) sont également gourmands en mémoire.
u L'accès au données reste séquentiel, mais il est néanmoins rapide.
u Le parcours des arbres, c'est-à-dire le passage par tous les nœuds et feuilles se fait en général de manière récursive. 92 Parcours d’un arbre binaire 1
2 3
4 5 6
7 8 9 10
97
u Méthodologie
Plusieurs méthodes permettent d’accéder à tous les nœuds d’un arbre binaire.
Son parcours complet peut-être décrit récursivement par les actions :
- traiter la racine
- parcourir le sous-arbre gauche
- parcourir le sous-arbre droit
Il y a six séquencements possibles pour ces actions.
Les trois parcours suivant sont les plus classiques.
u Parcours préfixé
Ce parcours est également appelé parcours en préordre ou descendant gauche droite.
Il traite d’abord les nœuds de la branche la plus à gauche en descendant.
- traiter la racine
- parcourir le sous-arbre gauche
- parcourir le sous-arbre droit
procedure prefixe(entree p : pointeur)
Debut si p <> NULL
alors afficher(p ? val) prefixe(p ? g) prefixe(p ? d) sinon afficher(f)
fin si
Fin
Premier appel : prefixe(racine)
Résultat :
1 2 4 7 f f 8 f f 5 f 9 f f 3 f 6 f 10 f f
u Parcours postfixé
Ce parcours est également appelé parcours en postordre ou ascendant gauche droite ou en ordre terminal.
Il traite en dernier les nœuds de la branche la plus à droite en remontant.
- parcourir le sous-arbre gauche
- parcourir le sous-arbre droit
- traiter la racine
procedure postfixe(entree p : pointeur)
Debut si p <> NULL alors postfixe(p ? g) postfixe(p ? d) afficher(p ? val) sinon afficher(f)
fin si
Fin
Résultat : 102
f f 7 f f 8 4 f f f 9 5 2 f f f f 10 6 3 1
u Parcours infixé
Ce parcours est également appelé parcours symétrique, projectif ou hiérarchique canonique.
- parcourir le sous-arbre gauche
- traiter la racine
- parcourir le sous-arbre droit
procedure infixe(entree p : pointeur)
Debut si p <> NULL alors infixe(p ? g) afficher(p ? val)
infixe(p ? d)
sinon afficher(f)
fin si
Fin
Résultat : 104
f 7 f 4 f 8 f 2 f 5 f 9 f 1 f 3 f 6 f 10 f
L'expression 2*5+2*(cos((5*3.14)/180)) peut se représenter de la façon suivante
+
* *
2 5 2 COS
/
* 180 105
5 3.14
u Un graphe est un ensemble de nœuds reliés par des liens.
u Ce n'est plus un arbre dès qu'il existe deux parcours différents pour aller d'au moins un nœud vers un autre.
u Un graphe est connexe, lorsqu'il est possible de trouver au moins un parcours permettant de relier les nœuds deux à deux (un arbre est un graphe connexe).
u Un graphe est dit pondéré lorsqu'à chaque lien est associé une valeur (appelée poids).
u On utilisera les graphes pondérés par exemple pour : - gérer des itinéraires routiers (quelle est la route la plus courte pour aller d'un nœud à un autre).
- gérer des fluides (nœuds reliés par des tuyauteries de diamètre différents).
- simuler un trafic routier.
- simuler un circuit électrique.
- prévoir un ordonnancement
u Un graphe est dit orienté lorsque les liens sont unidirectionnels.
u On peut représenter un graphe de manière dynamique, comme les arbres.
u Une autre solution consiste à numéroter les N sommets et d'utiliser une matrice carrée NxN, avec en ligne i et en colonne j un 0 si les nœuds i et j ne sont pas reliés, le poids de la liaison sinon.
u Un problème important est le parcours d'un graphe : il faut éviter les boucles infinies, c'est-à-dire retourner sur un nœud déjà visité et repartir dans la même direction.
Pour cela, on utilise des indicateurs de passage (Booléen) 108 ou une méthode à jeton.