créer un site internet




 
 

Awk : meta calcul l'occurence des mots dans une page

Ce petit bout de script permet de regarder les mots utilisés sur une page html, cela permet ensuite d'optimiser l'écriture des directives META avant d'enregistrer votre page dans un moteur de recherche.

Ce script test aussi pour chaque mots clé que vous avez donnés le nombre d'occurence de ce mots ( ou expression ) dans la page. Un résultat de 3 pour chaque mots clé est un minimum pour éspérer avoir un bon référencement. Attention: plus dix et certains moteurs rejètent la page considérant que vous faites du spamming.
#!/bin/bash

if test $# -lt 1 ; then
  echo "usage: meta [-s min_occurence ] <filename>"
fi

if test "$1" = "-s" && test $# -ge 3 ; then
  export SEUIL="$2"
else
  export SEUIL="3"
fi

while test $# -gt 0 ; do
    echo "^[[31m$1^[[30m"
    awk '

    BEGIN {
      FS="[ \t,:.!?\)\(]+"
    }
    /<meta name="keywords"/ {
      gsub(/^.+content="/,"")
      gsub(/">.*$/,"")
      l = split($0,a,/ *, */)
      for ( i in a ) {
        m[a[i]] = 0
      }
    }
    /<body/ { status = 1 }
    status == 1 {
      gsub(/<[^>]*>/,"")
      ligne=tolower($0)
      if ( length(ligne) ~ /^[ \t]+$/ )
        next
      for ( i=1 ; i<=NF ; i++ )
        b[tolower($i)]++
      for ( i in m ) {
        while ( match(ligne,i) ){
          sub("" i," ", ligne)
          m[i]++
        }
      }
    }
    END {
      for ( j in b )
        if ( b[j] >= ENVIRON["SEUIL"] && length(j) > 2 )
          printf("%02d - %s\n",b[j], j)
      for ( j in m )
        printf("-- %02d - %s\n",m[j], j)
    }
    ' $1  | sort -r
    shift
done

A propos - Contact - Réalisé avec Youhp3 v3.8 - v7.0 béta
Mentions Légales - CNIL n°800914
© AffilZEN 1998 - 2008 :: Auteur Nicolas : CV - NiKoZEN : Référencement
Part. : Créer un site, Creer son site