Après 14 ans d'existence, le site de notre association dispose d'un volume de contenu (grotesque) assez important. Ainsi, le volume en base des messages sur le forum flirte avec les 20Mo, celui des compte-rendus de LAN 2Mo, les actualités 1,5Mo, les articles 1Mo. Si le site dispose d'un moteur de recherche (également disponible sous forme d'extension firefox), il agréable d'avoir en bas de page, le contenu similaire présent sur le site.
Pour le forum, nous utilisons depuis plusieurs années, une extension Precise Similar Topics qui permet de relier les sujets similaires entre eux. Aujourd'hui, nous faisons de même avec le reste du contenu du site : les actualités, les articles, les compte-rendus.
Niveau technique, le calcul de similarité se fait via l'utilisation de la recherche texte de mysql : MATCH, AGAINST. Si vous souhaitez un exemple concret de code implémentant cette solution, je vous invite à lire ce sujet : Creating a related or similar posts using PHP & MySQL