La question des commentaires

« Imagine what you would need to tell to someone who is reading your code, if you were sitting next to them. This is what you put in comments » – Jonathan Boccara (lien)

« Imagine comments didn't exist. This is how you should write your code » – Brittany Friedman (lien)

Une question récurrente pour qui met la main à la pâte du côté de la programmation : il faut commenter le code, mais... Comment? Combien de commentaires mettre? Où commenter? Quoi exprimer? Quelle devrait être la part de texte et de code autodocumenté dans la clarification du propos dégagé par un programme?

Quelques réflexions suivent :

De l'art du commentaire : http://www.icsharpcode.net/TechNotes/Commenting20020413.pdf
De l'usage judicieux du commentaire :
- http://msdn.microsoft.com/en-us/library/Aa164797
- texte de John Mueller en 2011 : http://blog.johnmuellerbooks.com/2011/11/21/creating-useful-comments.aspx
- recommandations de Jane Street en 2014 : https://blogs.janestreet.com/10-tips-for-writing-comments-plus-one-more/
- la vision de Linus Torvalds, en 2016 : https://lkml.org/lkml/2016/7/8/625
- dans ce texte de 2017, Robert C. Martin met de l'avant un cas où le code autodocumenté est presque impossible à réaliser, et où les commentaires sont la solution la plus judicieuse : http://blog.cleancoder.com/uncle-bob/2017/02/23/NecessaryComments.html
Les commentaires sont plus importants que le code (par Jef Raskin) : http://queue.acm.org/detail.cfm?id=1053354
Comment écrire des commentaires : http://dkrukovsky.blogspot.com/2005/07/how-to-write-comments.html
Commentaires XML à même le code de langages .NET : http://msdn.microsoft.com/fr-fr/magazine/cc302121%28en-us%29.aspx
Écrire des commentaires en vue d'utiliser Javadoc : http://www.oracle.com/technetwork/java/javase/documentation/index-137868.html

Code Comments (Source)

Pratiques malsaines :
- exemple d'abus de commentaires : http://thedailywtf.com/Articles/The-Road-to-Hell.aspx
- cinq types de commentaires à éviter : http://repeatgeek.com/career/5-types-of-comments-to-avoid-making-in-your-code/
- quelques commentaires suspects dans les sources de Unix, rapportés par Dennis Ritchie : http://cm.bell-labs.com/cm/cs/who/dmr/odd.html
- le commentaire redondant, qui n'apporte rien et finit par diverger de l'implémentation, illustré (littéralement) en 2016 : http://www.commitstrip.com/en/2016/07/27/documentation-just-before-vacation?
Réflexions sur le rôle des commentaires : http://www.codinghorror.com/blog/2006/12/code-tells-you-how-comments-tell-you-why.html
Coder sans commentaires : http://www.codinghorror.com/blog/2008/07/coding-without-comments.html
Pourquoi et comment commenter : http://www.cprogramming.com/tutorial/comments.html
Si les commentaires sont laids, alors le code est laid : http://www.itworld.com/development/84780/if-comments-are-ugly-code-ugly
Quelques mythes à propos des commentaires : http://jasonmbaker.com/myths-about-code-comments
Comment l'écriture de commentaires évolue avec l'expérience de la programmeuse ou du programmeur : http://steve-yegge.blogspot.com/2008/02/portrait-of-n00b.html
En 2012, Zachary Voase blâme les éditeurs de code et leur manière de mettre en valeur les commentaires pour l'abondance de commentaires inutiles ou inutilisés dans nos programmes : http://blog.zacharyvoase.com/2012/09/07/comments/
Discussion de diverses façons de commenter, par Ted Spence en 2012 : http://www.altdevblogaday.com/2012/09/20/the-elements-of-comment-style-2/
En 2013, Mike Grouchy vous signale que votre code a bel et bien besoin de commentaires : http://mikegrouchy.com/blog/2013/03/yes-your-code-does-need-comments.html
Cinq bonnes raisons d'éviter d'écrire des commentaires à même le code, par Paul Oortins en 2013 : http://pauloortins.com/5-reasons-to-avoid-code-comments
Texte de 2013 par Sam Koblenski qui avoue que plus il progresse dans sa carrière de programmeur et moins il commente, réervant les commentaires pour des cas pointus : http://sam-koblenski.blogspot.de/2013/07/dont-comment-your-code-write-better-code.html
En 2013, Sam Koblenski offre une taxonomie des programmeuses et des programmeurs et de leurs pratiques quant aux commentaires : http://sam-koblenski.blogspot.ca/2013/07/a-taxonomy-of-code-and-comments.html
Utiliser les commentaires... de manière judicieuse, et avec parcimonie : http://www.haskell.org/haskellwiki/Commenting
Comment Eric Lippert abord la question des commentaires, un texte de 2014 : http://ericlippert.com/2014/09/08/comment-commentary/
Texte de 2014 présentant ce que Ram Rachum estime pertinent à titre de commentaires : http://blog.ram.rachum.com/post/103051530508/code-comments-that-i-find-helpful
En 2010, John D. Cook explique ce qui l'a converti aux vertus du code autodocumenté : http://www.johndcook.com/blog/2010/07/21/what-does-this-code-do/
Texte d'Andrzej Krzemieński en 2015 mettant en relief un style de commentaire pas bête du tout : https://akrzemi1.wordpress.com/2015/04/22/a-clever-comment-style/
En 2015, Arne Mertz associe le recours aux commentaires à un échec sur le plan de la clarté : http://arne-mertz.de/2015/05/comments-mean-failure/
Toujours en 2015, Arne Mertz discute de la subjectivité du concept-même de lisibilité, en indiquant (les auteurs le savent déjà) que rendre un texte lisible au sens large a moins de sens que rendre un texte lisible pour un lectorat donné. Autrement dit, mieux vaut savoir à qui un texte s'adresse, et cela vaut aussi pour le code : http://arne-mertz.de/2015/11/whom-are-we-writing-code-for/
Allant plus loin encore, Alexander Heimonen explique par ce texte de 2015 pourquoi il estime que réduire les commentaires accroît la qualité du code : http://oberheim.github.io/comments/2015/08/05/skipping-comments-leads-to-higher-quality-code.html
Certains commentaires sont insérés pour une raison spécifique, et survivent longtemps... http://emacshorrors.com/posts/forget-me-not.html
Le bon et le moins bon des commentaires, de l'avis de Bill Sourour en 2017 : https://medium.freecodecamp.org/code-comments-the-good-the-bad-and-the-ugly-be9cc65fbf83
Commenter ou pas, telle est la question, du moins de l'avis de Jonathan Boccara en 2017 : http://www.fluentcpp.com/2017/05/02/to-comment-or-not-to-comment-that-is-the-question/

J'ai vu en 2015 sur Twitter cette perle que je me permets de paraphraser, et qui a trait aux formes que peuvent prendre les commentaires en C++, C# ou Java :

// signifie: "He, en passant..."
/* signifie: "assieds-toi, faut qu'on bavarde..."

Selon Linus Torvalds, un bon message lors d'un « commit » devrait ressembler à ceci : https://gist.github.com/matthewhudson/1475276
Truc par bête vu en 2017 pour passer simplement d'une zone commentée / non-commentée, en ne changeant qu'un seul caractère dans un fichier source :

Version commentée	Version non-commentée
`/* SuisJeCommenteOuPas(); //*/`	`//* SuisJeCommenteOuPas(); //*/`

Quelques trucs amusants trouvés dans les commentaires et dans la documentation de programmes existants : http://wiki.c2.com/?FunnyThingsSeenInSourceCodeAndDocumentation

Pour un exemple de l'intérêt de remplacer un commentaire par du code, voir cette animation dans un tweet de Ben Porter.

En 2018, Jason McCreary discute de cet acte important qu'est la suppression de commentaires : https://dev.to/gonedark/removing-comments--204k
Questionnement de Morri Feldman en 2018 sur notre capacité de coder sans commentaires : https://medium.com/appsflyer/can-we-code-without-comments-maybe-2075abfc2ace

Ce que je fais, personnellement

Comme toujours, l'essentiel est de respecter les standards en place dans votre milieu de travail. Pour le reste, ce qui suit doit être lu avec attention et discernement – la clé du code de qualité est la clarté, et du code mal documenté ou trop obscur mène à du code difficile à entretenir ou à optimiser.

Quand je travaille pour moi-même, je commente très peu, préférant le code autodocumenté. Cela ne veut absolument pas dire « Pat ne commente pas, je vais faire comme lui! » (je vous en prie, ne faites pas ça!); cela veut dire que je vise du code tellement clair que les commentaires y deviendraient superflus. En fait, je suis de ceux qui pensent que le meilleur commentaire est un commentaire à même le code; l'autodocumentation du code est, selon moi, nettement supérieure à toute annotation destinée aux programmeuses et aux programmeurs, du fait que le compilateur (ou l'outil de génération de code que vous privilégiez, s'il s'agit d'un interpréteur ou d'un hybride) lui-même est en mesure de l'analyser et de nous protéger contre nos propres bêtises. D'autres ont une position semblable (par exemple http://leonardo-m.livejournal.com/99562.html qui recommande de transformer le plus possible les commentaires en code).

J'utilise les commentaires pour ce qui échappe au compilateur, pour ce qui est strictement destiné aux humains, ou encore – quand l'outil s'y prête – pour insérer des métadonnées servant à des outils automatisant des tâches comme la génération de la documentation ou la génération de code de validation et de tests (les outils comme Javadoc, Doxygen ou les trucs tels que les commentaires XML dans les programmes C#). Pour le reste, si je peux indiquer dans le code ce qui me préoccupe, alors ce sera mon premier choix.

	Avec commentaires seulement	À même le code
Par exemple, pour tester les préconditions d'une fonction, un commentaire est utile au sens où les programmeuses et les programmeurs sont informés de la marche à suivre, mais les humains tendent à manquer ces indications qui leur sont destinées. Le compilateur, lui, est en général beaucoup plus alerte. L'exemple à droite, bien que limité, le démontre. Si les commentaires sont pertinents (et parfois essentiels : par exemple, ici, il n'est pas possible de valider à même le code les préconditions quant aux caractéristiques des zones pointées a priori par les paramètres dest et src), ils ne suffisent pas en pratique et des validations à même le code sont très nettement préférables. Plusieurs autres éléments de programmation se prêtent à une documentation à même le code plutôt que par des commentaires (le respect des invariants d'une classe, par exemple, ou le respect par une fonction ou par une méthode de ses propres postconditions). Si possible, la documentation et la validation de ces caractéristiques se fera de maniàre statique, par exemple à l'aide de techniques de métaprogrammation.	`// // memcpy(dest,src, n) // Preconditions: // - dest != 0 // - src != 0 // - src pointe vers au moins n bytes valides // - dest pointe vers une zone d'une capacite d'au // moins n bytes // void memcpy(void dest, const void src, size_t n) { auto d = dest; auto s = src; for(; d ++ = *s ++; ) ; return d; }`	`#include <cassert> // // memcpy(dest,src, n) // Preconditions: // - dest != 0 // - src != 0 // - src pointe vers au moins n bytes valides // - dest pointe vers une zone d'une capacite d'au // moins n bytes // void memcpy(void dest, const void src, size_t n) { assert(dest && src); auto d = dest; auto s = src; for(; d ++ = *s ++; ) ; return d; }`

Avec commentaires seulement

À même le code

Par exemple, pour tester les préconditions d'une fonction, un commentaire est utile au sens où les programmeuses et les programmeurs sont informés de la marche à suivre, mais les humains tendent à manquer ces indications qui leur sont destinées. Le compilateur, lui, est en général beaucoup plus alerte.

L'exemple à droite, bien que limité, le démontre. Si les commentaires sont pertinents (et parfois essentiels : par exemple, ici, il n'est pas possible de valider à même le code les préconditions quant aux caractéristiques des zones pointées a priori par les paramètres dest et src), ils ne suffisent pas en pratique et des validations à même le code sont très nettement préférables.

Plusieurs autres éléments de programmation se prêtent à une documentation à même le code plutôt que par des commentaires (le respect des invariants d'une classe, par exemple, ou le respect par une fonction ou par une méthode de ses propres postconditions). Si possible, la documentation et la validation de ces caractéristiques se fera de maniàre statique, par exemple à l'aide de techniques de métaprogrammation.

//
// memcpy(dest,src, n)
// Preconditions:
// - dest != 0
// - src != 0
// - src pointe vers au moins n bytes valides
// - dest pointe vers une zone d'une capacite d'au
//   moins n bytes
//
void *memcpy(void *dest, const void *src, size_t n) {
   auto d = dest;
   auto s = src;
   for(; *d ++ = *s ++; )
      ;
   return d;
}

#include <cassert>
//
// memcpy(dest,src, n)
// Preconditions:
// - dest != 0
// - src != 0
// - src pointe vers au moins n bytes valides
// - dest pointe vers une zone d'une capacite d'au
//   moins n bytes
//
void *memcpy(void *dest, const void *src, size_t n) {
   assert(dest && src);
   auto d = dest;
   auto s = src;
   for(; *d ++ = *s ++; )
      ;
   return d;
}

L'idée générale derrière les commentaires

Un commentaire, essentiellement, sert d'indication pour les programmeuses et les programmeurs quant à la nature ou au comportement d'éléments dans le code, qu'il s'agisse d'un fichier ou d'un module, d'un type, d'une fonction ou de quoi que ce soit d'autre.

Un commentaire utile enrichit la description naturelle du code, tout en demeurant léger et (surtout!) véridique. Ainsi, il faut à tout prix éviter des horreurs comme :

int i = 1; // affecter la valeur un à la variable i
//
// intialise le compteur i à 0. Parcourt les éléments de tab un à
// un et affiche chacun sur cout, une ligne à la fois
//
template<class T>
   void afficher_elements(const T tab[], int nelems) {
      for (int i = 0; i < nelems; ++i)
         cout << tab[i] << ' ';
   }

Ces commentaires, en effet, n'apportent rien à la lecture du code et vont trop loin (dans le cas de la description verbale de l'algorithme d'afficher_elements(), on peut supposer que le commentaire erroné tient du fait que le séparateur utilisé à l'origine a changé au fil du temps, mais que le commentaire n'a pas suivi). Un commentaire trompeur nuit à la lisibilité du code; vous n'en voulez pas, et vos collègues non plus.

Règle générale, un commentaire sert à guider les gens qui utilisent votre code. On veut savoir :

Ce que fait la fonction ou ce à quoi sert un type. Évidemment, si la fonction se nomme est_pair(), un commentaire disant qu'il s'agit d'un prédicat évaluant la parité d'un entier devient redondant, tout comme il est inutile de dire que Pile<T> est une pile d'éléments du type T (il peut être utile d'indiquer si la pile a une taille fixée a priori ou si cette taille s'adapte dynamiquement, par contre)
Ce à quoi le code client doit faire attention lors de l'utilisation d'un type ou, surtout, d'une fonction. Les principales considérations à documenter sont :
- les préconditions, c'est à dire ce qui doit s'avérer avant l'appel d'une fonction (p. ex. : indiquer si un paramètre doit être strictement positif)
- les postconditions, c'est-à-dire les effets de bord de la fonction (changements d'états visibles à l'extérieur de la fonction)
- les cas d'exceptions possibles et les garanties de sécurité offertes, en particulier du point de vue de la multiprogrammation – des threads – ou des exceptions, et
- la complexité algorithmique de la fonction

Un exemple de fonction convenablement documentée serait :

//
// trouver_si(debut,fin,pred) retourne un itérateur sur la première occurrence
// i dans l'intervalle à demi-ouvert (debut..fin( pour laquelle pred(*i) s'avère
//
// Préconditions: debut et fin constituent un intervalle à demi-ouvert valide
//                Pred est un prédicat applicable au type pointé
// Postconditions: mêmes que pred()
// Complexité: linéaire, donc O(n) si n == distance(debut,fin) présumant que
//             pred() soit O(1)
//
template <class It, class Pred>
   It trouver_si(It debut, It fin, Pred pred) {
      for (; debut != fin; ++debut)
         if (pred(*debut)) return debut;
      return fin;
   }

Remarquez aussi qu'il arrive que les commentaires puissent être remplacés par du code, particulièrement par des expressions statiques, donc évaluées à la compilation. Par exemple, ceci :

//
// Transforme val en int par une manipulation d'adresse pas très propre.
// ATTENTION: il faut éviter que la taille de val ne dépasse la taille
// d'un int, sinon seule une partie de val sera « transformée »
//
template <class T>
   int cacher_dans_entier(T val) {
      return *reinterpret_cast<int *>(&val);
   }

...peut être remplacé (très avantageusement!) par cela (voir ici pour des détails) :

template <class T>
   int cacher_dans_entier(T val) {
      static_assert(sizeof(T) <= sizeof(int));
      return *reinterpret_cast<int *>(&val);
   }

En effet, dans le premier cas, le programmeur doit être attentif au commentaire et s'auto-discipliner. Dans le second cas, le compilateur veille et intercepte les dérogations à la règle dès l'étape de génération du code (il n'y a aucun coût à l'exécution).

Le rôle des commentaires dans la conception d'un algorithme

Quand je travaille, je laisse des commentaires d'abord pour moi-même. Souvent, quand une pièce de code me semble perfectible, je débute mon commentaire par ICI: pour que le repérage ultérieur des zones à problème soit plus simple. Par exemple :

Noeud* prochain(Noeud *p) {
   return p->succ; // ICI: valider p au préalable
}
//
// ICI: version récursive (simple mais terriblement inefficace). Raffiner...
//
long fibonacci(int n) {
   return n == 0 || n == 1? n : fibonacci(n-1) + fibonacci(n-2);
}

Évidemment, dans du code de production, ces commentaires devraient pour l'essentiel disparaître. Un exemple de version plus sérieuse de ces fonctions (et des commentaires qui me semblent appropriés dans chaque cas) serait :

class PointeurInvalide {};
Noeud* prochain(Noeud *p) { // throw(PointeurInvalide)
   if(!p) throw PointeurInvalide{};
   return p->succ;
}
//
// Complexité O(n) en temps et en espace (on peut
// réduire la complexité en espace à O(1) ici, est-
// ce que vous voyez comment y arriver?)
//
long fibonacci(int n) {
   assert(n >= 0);
   vector<long> v(n+1);
   v[0] = 0; v[1] = 1;
   for(vector<long>::size_type i = 2; i <= n; ++i)
      v[i] = v[i-1] + v[i-1];
   return v[n];
}

Remarquez que je n'ai pas commenté le fait que prochain(Noeud *p) retourne le prochain Noeud à partir de p, puisque cela me semble implicite dans la signature et dans les noms utilisés.

Je n'ai pas non plus expliqué la suite de Fibonacci, mais j'ai indiqué la complexité de l'algorithme implémenté (ce qui peut être utile au code client). J'ai tenu pour acquis, ce faisant, que la suite de Fibonacci est de la culture générale pour les scientifiques, mais si j'avais eu un doute, j'aurais sans doute laissé un lien vers un site expliquant le tout. Une autre notice qui aurait pu être indiquée en commentaire ici aurait été le recours à de la programmation dynamique (probablement pas pour accompagner le prototype de la fonction mais peut-être pour accompagner sa définition).

J'ai laissé des commentaires pour indiquer au code client le type d'exception pouvant être levé, dans le cas de prochain(), puisqu'il s'agit d'une information que le programmeur peut mieux gérer que le compilateur.

J'utilise aussi des commentaires pour décrire mon algorithme avant de le coder. C'est ce que je veux exprimer quand j'explique à mes étudiant(e)s débutant(e)s que je commente avant de coder : tant que je ne peux pas exprimer clairement en mots mon intention, il est probable que je ne comprenne pas assez le problème pour essayer de le résoudre.

Un exemple banal de cette démarche irait comme suit :

template <class It>
   void trier(It debut, It fin) {
      //
      // si distance(debut,fin) est petit, faire un tri à bulles
      // sinon,
      //    trouver le centre de (debut..fin(
      //    trier (debut..centre(
      //    trier (centre..fin(
      //    fusionner les deux sous-séquences triées
      //
   }

Remarquez le niveau de détail, très général. Implémenté concrètement, le code résultant ressemble souvent aux commentaires initiaux, d'ailleurs, comme le montre l'extrait ci-dessous :

template <class It>
   void trier(It debut, It fin) {
      using namespace std;
      enum { SEUIL_BULLES = 10 };
      auto n = distance(debut, fin);
      if (n <= SEUIL_BULLES)
         tri_bulles(debut, fin);
      else {
         auto centre = debut;
         advance(centre, n / 2);
         trier(debut, centre);
         trier(centre, fin);
         fusionner(debut, centre, fin);
      }
   }

Il faut évidemment écrire fusionner() avec prudence dans un cas comme celui-ci, ou mieux encore, utiliser du code d'expert.