Que ce soit pour un nouveau développement ou une refonte significative, il est important de valider que le nouvel applicatif va répondre dans de bonnes conditions et sera capable de tenir le trafic attendu. Bien souvent, il faut pouvoir réaliser ces tests rapidement, entre la fin des développements qui ne sont jamais en avance et la date de mise en ligne que l’on ne veut pas repousser.
Comment réaliser ces tests ? Avec quels outils ? Comment construire sa campagne de test ? Quels indicateurs analyser pendant les tests ? Comment interpréter les résultats ? Nous vous proposons de partager notre expérience.
Hébergeur infogéreur de sites web critiques en 24/7. Nous équipes réalisent régulièrement des tests de charge sur des sites et applications variées avec des volumétries importantes. Nous vous partageons ici nos retours d’expérience de prestataire expert des tests de charge et performance.
Préambule sur le déroulement des tests
Avant de démarrer il faut comprendre comment vont se dérouler les tests.
Dans la majorité des cas, on va réaliser une série de tests successifs en faisant monter à chaque fois l’intensité du trafic. Cela va permettre de tester la capacité du site à tenir un niveau de trafic en mesurant à chaque fois les temps de réponse et les indicateurs techniques de l’infrastructure. On va ainsi aller chercher la limite du site. Il faut donc bien calibrer les scénarios du test pour qu’ils soient représentatifs de la navigation d’une journée ou d’un mois.
Exceptionnellement, on peut aussi faire des tests de résistance beaucoup longs, qui vont chercher à vérifier la tenue dans la durée, mais ce n’est pas le cas que nous allons développer ici.
Calibrer ses objectifs, le volume et type de trafic
La situation sera différente selon qu’il s’agit d’une application existante ou non. Avec une application existante, on va pouvoir travailler avec les logs de connexion, soit directement pour ré-injecter le trafic passé, soit pour les analyser et simuler un trafic très proche de la réalité. Pour une nouvelle application , il faut s’appuyer sur les hypothèses de trafic du service marketing en les challengeant avec une analyse de la concurrence.
Voici les valeurs à définir :
- Trafic global mensuel en nombre de visites,
- Trafic par jour ? quel est le profil par jour sur un mois, quel trafic le week-end par rapport à la semaine ?
- Courbe de trafic par heure sur une journée, quelle est la montée en charge le matin ? jusqu’à quelle heure la navigation est-elle significative ? Y a t-il un ou plusieurs pics d’audience ?
- Quel % de « survoleurs » ? le « survoleur » étant l’internaute qui arrive sur une page mais ne reste pas,
- Quel nombre de pages/visites en moyenne, avec et hors survoleurs ?
- Liste des pages les plus consultées ?
- Durée moyenne d’une session, intervalle de temps entre 2 pages ?
Si vous avez un historique de navigation, votre outil préféré d’analyse de trafic (Piwik/Matomo, Google Analytics) doit vous permettre de construire ce jeu de donnée rapidement. Vous pourrez ainsi de définir les « paliers » de tests: pour un objectif de trafic mensuel en visites et pages vues, on va définir un test correspondant sur 1h. Le tableau ci-contre illustre une telle simulation:
Notre test porterait ici sur la simulation d’environ 22.000 visites sur une heure avec 115.000 pages vues. On démarrerait les tests probablement à 5.000 pour monter progressivement par paliers de 2500.
Les outils de tests : Siege, Gatling et/ou JMeter?
Chez alfa-safety, nous utilisons principalement des outils libres: Siege, Gatling et JMeter; chacun présente ses points forts et faiblesses, et nécessite un apprentissage.
Gatling est un injecteur de scénarios de navigation, il permet :
- D’enregistrer un scénario de navigation, en cadençant l’enchainement des consultations de pages,
- De programmer les tests, en répétant un scénario ou en combinant plusieurs scénarios,
- De simuler un volume de trafic constant, ou avec une montée en charge, par exemple montée de 1 à 10 utilisateurs en 10s. Chez alfa-safety, nous privilégions le trafic constant, car la montée en charge est délicate à régler et vient polluer le travail.
Gatling est un bon outil de simulation de scénarios, son reporting est complet , en revanche son comportement est moins prévisible et 1 injecteur peut plafonner à partir de 60/75 users simultanés, il faut alors multiplier les injecteurs. A noter que ce nombre varie en fonction du nombre de requêtes par secondes générées par un user.
JMeter est un outil très puissant qui a beaucoup progressé et se révèle aujourd’hui le plus complet et le plus simple à utiliser:
- Il permet d’enregistrer simplement des scénarios de navigation avec des variables qui permettent des créer des navigations différentes: par exemple recherche sur un panel de produit,
- de purger le cache et les cookies à chaque itération afin de simuler le parcours de visiteurs uniques,
- de créer facilement des paliers d’injection
Quels indicateurs techniques analyser ?
Dans tous les cas, le logiciel de test est installé dans notre data center de manière à ce qu’il accède directement aux serveurs sans passer par internet, et donc sans que les résultats ne soient pas affectés par des ralentissements liés aux flux sur internet.
Très important, , il faut bien étalonner le nombre moyen de transactions par page requêtée pour pouvoir interpréter les résultats. Ce travail est bien à faire pour chaque campagne de test car ce ratio va dépendre du site, de l’échantillon de pages sélectionnées et du logiciel utilisé.
Les indicateurs clés des logiciels de test sont :
- le nombre de transactions, qui permettra de valider le nombre de pages interrogées sur la durée du test,
- le temps de réponse, soit une simple valeur moyenne, soit des percentiles pce qui permet une analyse plus fine,
- le nombre de users simultanés,
- Les données de transfert pendant le test (« transaction rate », « throughtput » en MB/sec,..),
En parallèle, il faut monitorer avec votre outil de supervision les indicateurs de bande passante, de consommation de ressources des serveurs, cela permet d’analyser les éventuels points de contention. Nous conseillons la mise ne place d’une plateforme Promotheus/Grafana qui va permettre de consolider tous les indicateurs pendant la durée précise du test. Tous deux sont des outils libres faciles à déployer et qui permettent une analyse croisée et très fine des indicateurs:
- Bande passante consommée,
- CPU load, RAM usage %, des serveurs,
- Activité de la base de données, req/sec,
- Comportement du cache Varnish si vous en avez un (% de hit/miss).
- Ne pas négliger de naviguer sur le site pendant le test, permet aussi de mesurer le comportement de votre applicatif en charge.
Combien de temps cela prend ?
Il ne faut pas sous-estimer le temps que prennent ces tests.
- La préparation de l’échantillon des pages et des scénarios doit être réalisée avec soin, les pages doivent être testées pour vérifier qu’elles ne génèrent pas d’erreur. La plan de test doit être établi, dans la pratique vous serez surement amenés à l’ajuster en fonction des résultats,
- La constitution d’un jeu de données pour tester la connexion à l’application ou un tunnel de transaction est aussi indispensable pour bien simuler mavigation.
- Nous conseillons de faire des tests unitaire de 10 à 30 minutes, voire d’1 heure. Moins de 10 minutes est trop court pour une mesure sérieuse. Après chaque test, il faut récupérer les résultats et les analyser. Il est souvent nécessaire de rejouer ou d’ajuster les paliers de test en fonction des résultats. Rapidement une dizaine de tests prendra la journée.
- Compiler les résultats pour analyser l’ensemble et en tirer les conclusions est la dernière phase qu’il ne faut pas négliger.
Au global, une campagne de test prendra 5 jours, sur 2 semaines, un peu plus la première fois, un peu moins si vous la rejouez à l’identique. En fait, 2 campagnes de tests ne sont jamais identiques, on aura toujours effectué quelques modifications entre les 2, et les objectifs seront affinés. Il faut se donner le temps de bien croiser les résultats, ajuster le plan de test, pour aboutir à quelque chose de bien cohérent. D’expérience, chaque campagne de test est différente et nécessite des ajustements, l’expérience du testeur est un facteur important dans la construction du plan de test et pour l’analyse des résultats.
Bref, le test de performance et de charge d’une application web est un métier en soi. Chaque application est différente et le contexte et les objectifs vont varier dans le temps. Si vous ne pratiquez pas cet exercice régulièrement, nous ne pouvons que vous conseiller de le confier à une société expérimentée, qui ira plus vite pour un résultat plus complet.