My Crush on Krush

... and other musical addictions.

Archive for the ‘ dev ’ Category

namespaces

no comment

Toujours sur mon entreprise de suggestions musicales j’ai bien avancé cette semaine en terminant la phase I à savoir la saisie de mots clés (au kilomètre). Chiant mais nécessaire. 28333 taggings pour 736 mots-clés distincts.

Afin de nettoyer ma liste de mots-clés ou tags je me suis mis en tête de caractériser la nature de mes mots-clés en les classant par catégories et ainsi faire un pas vers des playlists dignes d’un web sémantique en constituant des triplets: morceau X est mot-clé Y de nature Z. Le truc assez étonnant pour moi est que la liste des mots-clés de genre s’est clôturée assez vite alors que je traite les termes par nombre d’occurrences décroissant: ainsi je peux me dire que les genres de musique sont moins nombreux ou plus évidents que le reste des informations que je traite ? Le second cercle est alors emotions avec une logique qui est sans doute du même ordre.

J’ai fait des petits nuages de mots-clés sur habett.pl pour illustrer mon process et me donner de l’espoir que mon entreprise progresse.

Je commence évidement à avoir quelques regrets quant aux mots-clés déjà rentrés (infos qui manquent, imprécisions, angles ignorés) mais après tout c’est presque l’objet même de cette phase.

J’y retourne, more news later.

clés

no comment

En plein run sur mes mots-clés, je me pose des questions quand mes doigts s’agitent sur le clavier.

Dois-je écrire “instrumental” et non “-vocals” qui serait plus productif et élégant ? Je vois que je mets pas mal d’indications relatives aux saisons et que cela se recoupe souvent avec le mois de la playlist à laquelle le morceau appartient. Si je comprends bien comment je distingue l’hiver de l’été (quoique je tagge parfois cold, et que je distingue warm de hot) je me demande alors comment je fais la différence entre spring et autumn : spring vas avec des tags  comme optimism, uplifting ou reverb alors qu’autumn vas bien avec melancholy et moods. Quelques exemples :

winter : Biosphere (Patashnik),  The xx (Stars), Daniel Lanois (Duo Glide)

spring : Jon Hopkins (Fading Glow), Boozoo Bajou (Yma), Connie Stevens (Sixteen Reasons)

summer : Tipsy (Grossenhosen), Fortran 5 (Heavy Clouds Building), Edwin Starr (Runnin’)

autumn : Nobody (After the summer hits), Death in Vegas (Lever street), Nina Simone (That’s him over there)

Bref, je suis en plein dedans. Pour le moment je le fais assez librement sans trop m’inquiéter du retraitement, chassant juste les apaxs et les fautes de frappe. Je me demande comment je vais régler mes problèmes de singuliers/pluriels surtout  quand je constate que je distingue évidement blues et blue. Je mets minestrones, landmark et breakthrough sans trop réfléchir à l’impactcar la distinction m’échappe pour le moment.

il va donc y avoir un gros travail de relecture une fois que j’aurais fini au kilomètre.

Enfin, je renonce je crois à catégoriser mes mots-clés, alors que j’avais à peu près les catégories : season, context, drugs, instruments, usage, classification et moods. Je renonce car je me dis qu’au fini il y aura très très peu de conflits.

tag:pastoral semaine 1

no comment

Pour initier la série je tagge mes playlists, je vous présente le tag de la semaine, pastoral qui se réfère pour moi a la fusion des deux définitions les plus fréquentes, celle qui est champêtre (car bucolique n’est pas parlant pour moi) et celle relative aux choses du Pasteur. Je pense tout de suite à la candeur provinciale de Belle and Sebastian ou a la poésie rurale des vieux léonard Cohen. Mon univers n’est pas porté directement sur ce type de définitions mais j’apprécie ce type de musique. Une première analyse montre la proximité de folk, light et pop.

Le point dev de cette semaine est la question de la pondération des mots clés. Ma manière spontanée de tagger consiste a aller du principal à l’annexe, classiquement. Ainsi ais-je besoin de pondérer les associations de termes que je produis te non de faire du linéaire comme on le constate trop souvent. Ayant remarqué que je mettais plus de mots clés aux morceaux qui m’intéressent le plus, j’en viens à la conclusion que le plus simple est d’accorder un poids de 1 au dernier des mots clés puis d’incrémenter d’une décimale en remontant la liste. Ainsi le poids des premiers termes est plus important avec un bonus accorde aux morceaux plus lourdement taggés. Justice différentielle.

Mon travail d’indexation est à 20% complet donc il est dur de se rendre compte de quoi que ce soit, 5000 associations établies sur un corpus d’un peu moins de 900 termes soit une moyenne de 12 tags par morceaux. Dans mon plan je fais peu d’analyses pour le moment mais juste une chasse aux apaxs et aux termes se relevant vides par ubiquité.