Mission accomplie!

Publié le par lintia

 

Fin de la première etape


Pour parvenir au terme de la première partie du projet encadré, nous devions  produire un script qui nous permettrait d'ajouter  3 colonnes supplémentaires à notre "BEAUUUUU" tableau. Et c'est chose faite!!!!!!!! La première colonne, CONTEXTES, nous donne le texte brut. Soit  uniquement les occurrences de la forme verbale recherchée en français ou en portugais. Pour ce faire nous avons utlisé la commande egrep (recherche de motifs à l'aide de l'expression régulière suivante: achei|encontrei|dei com| j.ai trouv.) ainsi que la commande Perl accompagnée du programme minigrepmultilingue. La deuxième colonne, CONT EXTES HTML, quant à elle contient ces mêmes occurences mais cette fois ci dans une version HTML.

Enfin la dernière colonne nous donne le nombre total d'occurrences de la forme étudiée dans la page (l'URL) associée. On a également calculé la fréquence totale pour l'ensemble des pages ( fichiers globaux pour les contextes et les dumps).

Pour mieux comprendre nos propos nous vous invitons à jetter un coup d'oeil sur notre script ainsi que sur le tableau qui en resulte ( Attention âme sensible et sujette aux migraines s'abstenir!).        

 

 

script1script2script4.pngscript5script6.pngscript7.png

 

 

Resultat partie du tableau:

 

Capture1.pngCapture2.png

 

 

A suivre.....

 Lintia

Pour être informé des derniers articles, inscrivez vous :
Commenter cet article
S
Une année qui commence bien donc...
Répondre