My Crush on Krush

... and other musical addictions.

namespaces

no comment

Toujours sur mon entreprise de suggestions musicales j’ai bien avancé cette semaine en terminant la phase I à savoir la saisie de mots clés (au kilomètre). Chiant mais nécessaire. 28333 taggings pour 736 mots-clés distincts.

Afin de nettoyer ma liste de mots-clés ou tags je me suis mis en tête de caractériser la nature de mes mots-clés en les classant par catégories et ainsi faire un pas vers des playlists dignes d’un web sémantique en constituant des triplets: morceau X est mot-clé Y de nature Z. Le truc assez étonnant pour moi est que la liste des mots-clés de genre s’est clôturée assez vite alors que je traite les termes par nombre d’occurrences décroissant: ainsi je peux me dire que les genres de musique sont moins nombreux ou plus évidents que le reste des informations que je traite ? Le second cercle est alors emotions avec une logique qui est sans doute du même ordre.

J’ai fait des petits nuages de mots-clés sur habett.pl pour illustrer mon process et me donner de l’espoir que mon entreprise progresse.

Je commence évidement à avoir quelques regrets quant aux mots-clés déjà rentrés (infos qui manquent, imprécisions, angles ignorés) mais après tout c’est presque l’objet même de cette phase.

J’y retourne, more news later.

Tags: , , ,

Leave a Reply