Auteur : tadanobu | 20:52:06 15/09/2018 |
Description Imaginons deux films, ayant chacun 5 notes et une moyenne de 7.5. Actuellement, ils sont classés strictement ex-aequo. Précisons maintenant que le premier a été noté par rlmtruffo, yayap, loris, -blondin- et max9 avec des notes de 6,5 - 7 - 7,5 - 8 -8,5. Le second, lui a été noté par rastignac, kino, yorda, resolution et moi-même avec les mêmes notes. Ceux qui connaissent assez bien les membres comprennent vite le problème : le premier film a été noté par des gens globalement généreux alors que le second l'a été par des membres plutôt sévères. Comment rendre compte de cela ? Avant de répondre à cette question, précisons que l'objectif n'est bien évidemment pas de donner plus ou moins de poids à chaque membre. De toute façon, on sait déjà très bien que la moyenne n'est qu'un indicateur forcément approximatif puisque fruit de plusieurs facteurs tous plus subjectifs les uns que les autres. Toujours est-il qu'il serait utile de noter qu'à note équivalente et en comparant les membres, les différences d'appréciation de chaque membre en fonction de leur propre barème subjectif ne sont pas mise en avant. Vient alors l'idée de pondérer les moyennes. Dans les grandes lignes, l'idée est d'ajouter ou de retirer quelques dixièmes à chaque note en se basant sur la notation de chaque membre. Si un membre note en général au-dessus de la moyenne de la fiche, sa note calculée dans la moyenne sera rabotée de quelques dixièmes. Inversement, si un membre note souvent en-deçà de la moyenne, on pourra ajouter quelques dixièmes à sa note pour calculer la moyenne. Vous commencez à avoir mal à la tête et relire plusieurs fois ce qui est écrit ? Est-il donc nécessaire de vous présenter un algorithme de calcul ? Pour les plus matheux d'entre vous, je dirai que je calcule l'écart-type entre la note d'un membre et la moyenne d'une fiche et que seul un certain pourcentage (tenu secret) de cet écart-type est ajouté/retranché à la note pour calculer la moyenne. Pour ménager vos méninges et être plus concret, voici quelques exemples. Si je reprends les deux cas d'études du début d'idée, le premier film se retrouverait avec une moyenne de 7.11 alors que le second obtiendrait 7.98. Cela peut sembler un écart important mais on a ici un cas bien particulier qui n'arrive probablement jamais. C'est avant tout pour mettre en lumière le mécanisme. Prenons donc quelques exemples plus réalistes avec le Top 5 actuel. Film - Moyenne actuelle - Moyenne pondérée La Condition de l'homme III - 8.65 - 8.7 Il était une fois dans l'Ouest - 8.57 - 8.55 À l'ouest des rails - 8.55 - 8.61 Mulholland Drive - 8.52 - 8.5 Barry Lyndon - 8.51 - 8.51 Quelques autres exemples du Top 50 qui changent plus Le miroir - 8.14 - 8.24 La Vie d'Oharu, femme galante - 8.22 - 8.4 Love Streams - 8.19 - 8.43 De manière générale, cela a plutôt tendance à augmenter légèrement les moyennes (logique, sachant qu'il y a plus de membres très sévères que très généreux). Ce nouveau mode de calcul ne serait appliqué qu'à partir de 20 notes afin de conserver le top découverte tel qu'il est actuellement et éviter que les membres sévères puissent facilement y faire grimper des films qu'ils ont aimé. Tout ça, évidemment, est encore expérimental et l'algorithme peut être retravaillé. |
OK avec le principe de pondérer une moyenne en fonction de si on a affaire à quelqu'un de généreux ou strict. Un 8/10 venant d'un membre ne mettant jamais moins de 7 est plus anecdotique que venant de quelqu'un qui dépasse rarement 7, et c'est bien de le faire ressentir sur la moyenne.
Ce qui me chiffonne est le calcul de l'écart-type. Je ne suis pas sûr d'avoir compris, arrête-moi si j'ai tort: il est basé sur l'écart entre chacune des notes d'un membres et la moyenne de chacun des films notés ?
Donc s'il ne donne que des 1 et des 10 il va avoir un écart-type élevé, donc il influencera énormément les moyennes, contrairement à quelqu'un qui noterait de manière nuancée ?Message édité