frutch [wiki]

FaQ

Forum aux questions

Le but de ce FAQ est de rassembler des informations utiles qui ne figurent pas forcément dans la documentation de Nutch

Utilisation de Nutch

Indexation

Comment spécifier que l'on veut charger totalement l'index en mémoire RAM ?
Nutch permet de charger en mémoire l'index des pages plutôt que de lire les pages sur disques. Cela accroît considérablement les performances (1 -> 20 requêtes seconde).
Mais la chose se fait-elle automatiquement ou faut-il le spécifier quelque part ?
Comment indexer des fichiers en local ?
Cf. la page NutchLocal.
Comment désactiver la mise en cache des pages lors du crawl ?
Un JIRA a ete ouvert pour permettre de desactiver la mise en cache pour le protocole file. Cela n'est donc tjrs pas possible... mais pour bientot !
Il y a un commentaire sur cette page. [Afficher commentaires/formulaire]