Awk : meta calcul l'occurence des mots dans une page
Ce petit bout de script permet de regarder les mots utilisés sur une page html, cela permet ensuite d'optimiser l'écriture des directives META avant d'enregistrer votre page dans un moteur de recherche.Ce script test aussi pour chaque mots clé que vous avez donnés le nombre d'occurence de ce mots ( ou expression ) dans la page. Un résultat de 3 pour chaque mots clé est un minimum pour éspérer avoir un bon référencement. Attention: plus dix et certains moteurs rejètent la page considérant que vous faites du spamming.
#!/bin/bash
if test $# -lt 1 ; then
echo "usage: meta [-s min_occurence ] <filename>"
fi
if test "$1" = "-s" && test $# -ge 3 ; then
export SEUIL="$2"
else
export SEUIL="3"
fi
while test $# -gt 0 ; do
echo "^[[31m$1^[[30m"
awk '
BEGIN {
FS="[ \t,:.!?\)\(]+"
}
/<meta name="keywords"/ {
gsub(/^.+content="/,"")
gsub(/">.*$/,"")
l = split($0,a,/ *, */)
for ( i in a ) {
m[a[i]] = 0
}
}
/<body/ { status = 1 }
status == 1 {
gsub(/<[^>]*>/,"")
ligne=tolower($0)
if ( length(ligne) ~ /^[ \t]+$/ )
next
for ( i=1 ; i<=NF ; i++ )
b[tolower($i)]++
for ( i in m ) {
while ( match(ligne,i) ){
sub("" i," ", ligne)
m[i]++
}
}
}
END {
for ( j in b )
if ( b[j] >= ENVIRON["SEUIL"] && length(j) > 2 )
printf("%02d - %s\n",b[j], j)
for ( j in m )
printf("-- %02d - %s\n",m[j], j)
}
' $1 | sort -r
shift
done
Awk : meta calcul l'occurence des mots dans une page : micro annuaire
| cygwin | : | le compilateur gcc sous windows ainsi que tous les outils unix (awk, grep, sed, bash, ksh ...). |
| Youhp3 | : | Youpee est un preprocesseur HTML pour vous simplifier toutes les tâches répétitives dans la création d'un site web. Salemioche.net utilise trés largement ses possibilités. |
