Installation de Nutch
Il est tout à fait intéressant de procéder à l'installation de Nutch. Cela permettra au lecteur de se rendre compte concrètement du déroulement pratique du crawling et de l'indexation effectuée par un moteur de recherche.Le lecteur est ainsi invité à procéder à une série de tests avant d'entamer l'étude du fonctionnement de Nutch.
Pré-requis
L'utilisation du système d'exploitation Linux est vivement conseillée. Dans le cadre de ce document, nous ferons l'hypothèse qu'une distribution Linux est employée, c'est pourquoi nous décrirons uniquement les procédures d'installation et d'utilisation sous Linux.Pour pouvoir utiliser Nutch, les pré-requis suivants sont nécessaires :
- Java (version 1.4.x ou supérieure). Il faudra veiller à définir ultérieurement la variable NUTCH_JAVA_HOME vers la racine de l'installation de la machine virtuelle java (export NUTCH_JAVA_HOME=/chemin/vers/JVM) ;
- Le conteneur de servlet Tomcat (version 4.x ou supérieure) de la distribution Apache ;
- Pour une utilisation Windows, l'environnement UNIX Cygwin doit être installé ;
- Un gigabyte d'espace disque ;
- Une connexion à haut débit.
Installation
La dernière version de Nutch peut être téléchargée à l'adresse suivante :http://www.nutch.org/release/
Le fichier doit simplement être décompressé et copié dans un dossier.
Il n'y a pas de commentaire sur cette page.
[Afficher commentaires/formulaire]