BoyWiki:Agora/30 janvier 2013

De BoyWiki

Agora/30 janvier 2013

Citations en double

Pinocchio, tu as corrigé sur la page Henry de Montherlant (citations) l'identifiant d'une des citations, qui est un doublon venant de la page Citations sur l’âge de treize ans. Comme tu connais mieux que moi le fonctionnement de ce système, j'en profite pour te demander ce qu'il vaut mieux faire dans un tel cas, qui risque de se reproduire assez fréquemment :

  • recopier la citation d'origine intégralement (avec son identifiant)
  • recopier en supprimant l'identifiant, pour qu'un nouveau soit automatiquement créé
  • affecter à la copie le paramètre |cdj=non

Je ne sais pas si la première solution pose un problème technique.

La deuxième présente comme inconvénient (relatif) que cette citation, statistiquement, reviendra plus souvent. A l'extrême (très rarement), elle restera la même deux jours de suite, mais avec un lien vers des pages différentes.

La troisième solution comporte un inconvénient plus grave : si pour une raison ou une autre la citation originelle était supprimée, on ne penserait pas forcément à "réactiver" sa copie, et la citation n'apparaîtrait plus jamais sur la page d'accueil.

Caprineus 30 janvier 2013 à 21:15 (GMT)

Je pensais qu'il s'agissait d'une erreur. Si c'est volontaire alors la première solution est la plus transparente à l'usage puisque les doublons sont ignorés lors de la sélection des citations, celle-ci n'apparaitra qu'une fois. Le problème c'est qu'il ne sera plus possible de distinguer les doublons involontaires, l'affectation de l'identifiant étant pseudo-aléatoire entre des bornes limitées, ceci peut arriver (mais ne s'est pas encore produit). Dans ce cas l'une des citations portant l'id en double n'apparaitra jamais.
Pinocchio 30 janvier 2013 à 22:06 (GMT)
Si je comprends bien, lors de la création d'un nouvel identifiant, rien ne garantit qu'il soit vraiment nouveau. Mais que fait la police ?!
Mathématiquement, donc, quand 1 seule citation a été créée, il y a 1 chance sur 10 000 000 que la citation suivante porte le même identifiant. Quand 100 citations ont déjà été créées, le risque de doublon pour la 101e est de 1 sur 100 000. Et lorsque 1000 citations existeront, la suivante aura 1 chance sur 10 000 d'être un doublon. Sur la totalité des 1000 citations suivantes, il y aura donc plus d'1 chance sur 10 qu'apparaisse un doublon. Est-ce une probabilité acceptable, ou trop forte ?
Ce que je ne comprends pas, c'est comment tu distingues ces doublons involontaires (même identifiant pour des citations différentes) pour les éliminer. Et est-ce que ce sera encore possible assez facilement avec 1000 citations ou plus ?
La meilleure solution pour s'assurer que toutes les citations passent à tour de rôle serait quand même peut-être la deuxième (avec le très léger inconvénient éventuel que j'indiquais).
Caprineus 30 janvier 2013 à 23:58 (GMT)
Tout à fait. Il est trop compliqué et long de vérifier lors de la création si un identifiant existe déjà. On fait donc confiance au hasard qui pour le moment a rempli son rôle. La vérification se fait au moment de la sélection des citations du jour à paraitre. Il y a actuellement environ 260 citations et ce contrôle de visu suffira pour encore quelques temps. Si je me souviens bien c'est la première fois qu'une erreur est détectée.
La seconde solution fonctionne aussi mais ne permet plus de filtrer les doublons.
Pinocchio 31 janvier 2013 à 09:10 (GMT)