Scoring system : pertinence "sur mesure"
Kentika dispose, depuis la version 3.0.1, d'un puissant moteur de calcul de pertinence permettant de proposer des listes systématiquement triées suite à une recherche ou à l'affichage du contenu d'un dossier.
Ce moteur prend en compte trois catégories de paramètres :
- la pertinence d'un résultat par rapport à la requête effectuée ;
- la pertinence intrinsèque d'une ressource ;
- la pertinence de la ressource pour la personne qui a posé la question.
Les pertinences prises en compte
Pertinence par rapport à une requête
Lorsqu'un utilisateur effectue une recherche, cette dernière peut porter sur différentes rubriques. Ces rubriques n'ont cependant pas la même importance : un mot trouvé au début un titre doit avoir plus de poids que vers la fin d'un résumé. Une expression correspondant à un descripteur aura un poids plus important que si elle est trouvée dans le texte intégral.
Point fort : Kentika est une solution nativement multilingue. Quelle que soit la langue utilisée pour exprimer une requête, la pertinence du document sera identique.
Pertinence intrinsèque
Les documents mis à disposition ne présentent pas tous le même intérêt, même si ils répondent de la même manière à une question posée. Les critères permettant de définir, a priori, l'intérêt d'un document peuvent être très variables et dépendent de la nature du fonds. Kentika dispose de toute information sur le document lui-même et sur le flux d'intérêt qu'il provoque : tous ces éléments permettent de calculer un score a priori. Ainsi, un article du jour peut avoir plus d'intérêt qu'un article du mois dernier ; un texte de loi abrogé est moins pertinent qu'un texte en vigueur ; un ouvrage souvent emprunté est supposé plus intéressant qu'un qui ne sort jamais ; une photo ayant recueilli un nombre élevé de notes positives sera mise en avant ; un article de priorité haute devrait apparaître un de priorité basse.
Pertinence pour la personne
Une base Kentika peut comporter une grande variété d'informations pour une grande variété de profils d'utilisateur. Lors d'une recherche, une personne préférerait voir apparaître en tête de liste les documents qui seraient issus du service auquel elle appartient. Ceci est particulièrement vrai lors de l'utilisation de Kentika Team qui permet de créer des équipes et d'y rattacher des personnes et des documents.
Activer le calcul de pertinence
Pertinence à la recherche
La mise en œuvre s'effectue simplement en paramétrant ses propres règles.
Dans "Préférences/Serveur Web/Paramètres de connexion" : cliquez sur "Atomic Spécial" et cliquez sur la ligne du code "SiPE" (Critères de pertinence).
La valeur saisie peut être composée de plusieurs lignes construire de la manière suivante : n° du champ (voir dans structure) : poids du champ (compris entre 1 et 10)
Exemple de valeur conforme
21:5
141:3
131:1
9990:1
9999:1
score:5
1064=1341:3
Dans cet exemple, le titre (21) aura un poids de 5, un descripteur (141) : un poids de 3, le commentaire (131) / la zone de contenu (9990) / les fichiers liés (9999) : un poids de 1.
NB : l'ordre de déclaration des champs n'a aucune influence sur le résultat. Si un pertinence doit aussi être appliquée aux tables autres que "Document", il suffit de compléter la liste : Kentika ne retient que les champs appartenant à la table sur laquelle porte la recherche.
Pertinence sur les champs texte
Lorsque Kentika trouve l'expression recherchée dans un champ texte (exemple : le titre, le commentaire, la zone de contenu ...), un poids relatif est également appliqué en fonction de la position relative de chaque mot de l'expression dans le champ dans lequel elle a été trouvée.
Pertinence sur un champ thesaurus
Lors d'une recherche, l'autopostage peut être activé. Kentika collecte alors l'ensemble des descripteurs utilisés et les considère comme pertinents par rapport à la question posée. Ainsi, si une recherche sur "Alpes" permet d'identifier un document indexé avec "Chamonix", ce dernier héritera du niveau de pertinence affecté au champ descripteur.
Pertinence sur les alias, les synonymes et les traductions
Lorsque Kentika effectue une recherche, en fait cela peut se traduire par un nombre significatif de requêtes unitaires. Tous les "chemins empruntés" par le moteur de recherches sont compilés et exploités pour déterminer la pertinence. Si on recherche avec l'expression "Voiture" ou "Macchina" ou encore "Automobile", un article indexé avec "Peugeot" sortira avec la même pertinence qu'un avec "Renault".
NB : ceci suppose que, dans le thesaurus, "Automobile" ait pour synonyme "Voiture", comme traduction "Macchina" et pour terme spécifique "Peugeot" et "Renault"
Pertinence sur la recherche plein texte
Lors d'une recherche dans les documents (via KDE) le moteur Lucene calcule la pertinence du document trouvé par rapport à la question posée. Cette pertinence est ensuite intégrée dans le calcul de pertinence comme si Kentika l'avait identifiée dans la base de données.
Pertinence intrinsèque : le champ "score"
Le score est calculé a priori et est indépendant de la recherche. Cependant, il est injecté dans le calcul de pertinence du résultat afin de privilégier certains documents. La valeur du score s'établit sur une échelle de 0 à 10, elle permet d'influer significativement sur la place qu'occupe chaque document dans un résultat.
Le champ "score" est utilisé dans le paramètre décrit ci-dessus en mentionnant simplement "score:" suivi du niveau d'importance que l'on souhaite donner à cette pertinence intrinsèque.
Le champ "score" peut être affiché dans une colonne de l'explorateur de données.
Concevoir une stratégie de "scoring"
Les fonds documentaires gérés dans Kentika sont variés, leurs utilisations aussi. Une stratégie de scoring doit tenir compte d'un ensemble de facteurs liés à la base documentaires. Le score est recalculé toutes les nuits via un script batch fourni et que l'on suggère d'adpter afin de prendre en compte ses spécificités.
Un document qui vient d'être ajouté à la base documentaire reçoit un score médian (5).
Pertinence pour la personne
La ligne correspondant à une pertinence relative s'exprime comme suit : Lorsque le champ X de l'utilisateur connecté est égal au champ Y d'un document, alors la pertinence de ce dernier est augmentée de N.
Dans l'exemple suivant :
1064=1341:3
on compare les valeurs du champ "1064" (Equipe d'appartenance) de l'utilisateur connecté aux valeurs du champ "1341" (Equipe propriétaire).
Auto-complétion
La pertinence est automatiquement mise en jeu dans les boites permettant de sélectionner une valeur correspondant à des caractères saisis.

Powered by KENTIKA Atomic - © Kentika 2020 tous droits réservés - Mentions légales