Forum aux questions
Le but de ce FAQ est de rassembler des informations utiles qui ne figurent pas forcément dans la documentation de NutchUtilisation de Nutch
Indexation
Comment spécifier que l'on veut charger totalement l'index en mémoire RAM ?
Nutch permet de charger en mémoire l'index des pages plutôt que de lire les pages sur disques. Cela accroît considérablement les performances (1 -> 20 requêtes seconde).Mais la chose se fait-elle automatiquement ou faut-il le spécifier quelque part ?
Comment indexer des fichiers en local ?
Cf. la page NutchLocal.Comment désactiver la mise en cache des pages lors du crawl ?
Un JIRA a ete ouvert pour permettre de desactiver la mise en cache pour le protocole file. Cela n'est donc tjrs pas possible... mais pour bientot !
Commentaires [Cacher commentaires/formulaire]
Quelqu'un connait-il la configuration au préalable pour activer le clustering ???? Est-elle active par défaut ??
Merci d'avance
Merci d'avance
-- KiDrEk? (2005-12-19 14:37:09)