Dimanche 30 novembre 2008 7 30 /11 /Nov /2008 20:07

Ca y est ! Elle est arrivée la freebox.

Depuis le début , j' ai utilisé Perl pour le projet parce que l' environnement Cygwin marche mal sur mon PC portable.( voir billet 1 )

Active Perl a été installé ainsi Wget sous Windows.

Lynx existe aussi sous Windows.

 

J' ai testé minigrepmultilingue.pl , il semble ok avec le russe

pour le thai il faut voir le problème de segmentation des phrases en mots.

le test a donné un fichier en sortie incorrect il liste toute la page

 

le motif recherché n' est pas correctement affiché dans le résultat !!

Par tukta
Ecrire un commentaire - Voir les 0 commentaires
Mercredi 26 novembre 2008 3 26 /11 /Nov /2008 15:54

http://perldoc.perl.org/Encode/Supported.html

 

Lang/Regions ISO/Other Std. DOS Windows Macintosh Others

Thai              iso-8859-11[3]   cp874              MacThai

 

pas d' indication Windows !!

 

for KOMODO from  Active State

You can edit a file in the installation. Search for koEncodingServices.py, and at line 170, add the following lines:

('cp874', 'Thai (CP-874)', 'CP874', '', 1,'cp874'),
('tis-620', 'Thai (tis620)', 'tis620', '', 1,'tis-620'),
('iso8859-11', 'Thai (ISO-8859-10)', '8859-10', '', 1,'iso8859-10'),

 

en unicode    le caractère   thai est codé : 0E00 - 0E7F

Par tukta
Ecrire un commentaire - Voir les 0 commentaires
Mercredi 26 novembre 2008 3 26 /11 /Nov /2008 14:53

Pour pouvoir modifier mes billets hors ligne , j' ai installé Windows Live Writer

suivant la procédure :

Création du compte
Liste des champs à remplir:

  • Choisir le type de blog : « Autre service de blog »
  • Url de la page d'accueil : thai.over-blog-fr.
  • Nom d'utilisateur : ????@ ?????.com
  • Mot de passe : ********
Une fois ces paramètre choisis, le logiciel se connecte rapidement à l'administration pour récupérer les paramètres de publication disponible sur la plate-forme.
  • Sélectionner le fournisseur : « Metaweblog API »
  • Url de postage distante : http://api.over-blog.com/mw
Une nouvelle connexion est effectuée pour finir la récupération des informations utiles.
Par tukta
Ecrire un commentaire - Voir les 0 commentaires
Jeudi 13 novembre 2008 4 13 /11 /Nov /2008 22:25

Sh

Mes scripts
Par tukta
Ecrire un commentaire - Voir les 0 commentaires
Jeudi 13 novembre 2008 4 13 /11 /Nov /2008 22:25

Mes programmes en Perl

fait-tableau-v3.pl  ( version Windows , Active Perl )

#!/usr/bin/perl
use File::Spec;

$cmdu = File::Spec->catfile("wget.exe"); # wget inclus dans path  de fait-tableau-v3.bat
$cmd = $cmdu ;
# $cmd= $cmd." --span-hosts "." --debug ";

print "Donnez le nom de fichier txt contenant les URLs  : \n"; #c'est la liste des pages wgettées
$entreeurl=<STDIN>;
chomp($entreeurl); #on supprime le retour chariot
$filehttp="URLS//".$entreeurl.".txt"; #lecture de ce que l'utilisateur entre au clavier et association à une variable
print "$filehttp\n";
chomp($filehttp); #on supprime le retour chariot
open(FILEIN,"$filehttp") or die "ouverture impossible: $!\n"; # ouverture du fichier des pages wgettées en lecture
# aspire tout d' un coup
#  wget -i url.txt -x -P "PAGES-ASPIREES"
# $cmd=$cmdu." -i ".$filehttp." -x "." -P  "."PAGES-ASPIREES" ;
#$cmd=$cmdu." -i ".$filehttp." -x "." -P  "."PAGES-ASPIREES" ;
#print $cmd ;
#system( "$cmd");

print "Donnez un nom de fichier html du tableau : \n"; #c'est la liste des pages wgettées
$entreehtml=<STDIN>;
chomp($entreehtml); #on supprime le retour chariot
$filehtml="TABLEAUX/".$entreehtml.".html";
print "$filehtml\n"    ;
chomp($filehtml);

open(FILEOUT,">$filehtml") or die "ouverture impossible: $!\n"; # ouverture du fichier HTML en écriture

print FILEOUT "<html>\n<head>\n<title>tableau de liens</title>\n</head><body>\n<table border=\"1\">\n" ; #code de début de tableau

# aspire une par une , stocke dans un sous dossier avec le nom complet du site
$pages="PAGES-ASPIREES/".$entreeurl;
$cmd=$cmd." -o ".$pages."-erreurs.txt" ;
while (<FILEIN>)
{
print $_; chomp($_);

$cmd=$cmd."  ".$_.  " -P  "."\"".$pages."\"" ." -x "  ;
$maligne="<tr><td><a href=http://".$_.">http://".$_."</a></td><td><a href=".$pages."/".$_.">".$_."</a></td></tr>" ;
print $cmd ;
system (  $cmd  ) ; #or die "execution de wget impossible: $!\n";

print FILEOUT $maligne  ;
}
print FILEOUT "\n</table>\n</body>\n</html>"; #code de fin de tableau
close(FILEIN);
close(FILEOUT);

# $url = quotemeta($url); se souvenir des meta symbole dans URLs

Par tukta
Ecrire un commentaire - Voir les 0 commentaires

Présentation

Créer un Blog

Recherche

Calendrier

Juin 2012
L M M J V S D
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30  
<< < > >>
Créer un blog gratuit sur over-blog.com - Contact - C.G.U. - Rémunération en droits d'auteur - Signaler un abus