frutch [wiki]

SyntheseCommandes

Synthèse des commandes de Nutch

Voici une synthèse des commandes utilisables de Nutch :

  • crawl : crawler en une étape pour les intranets ;
  • admin : administration de la base de données, incluant sa création ;
  • inject : injection de nouveaux urls dans la base de données ;
  • generate : générer des nouveaux segments à charger (fetching) ;
  • fetchlist : afficher la fetchlist d'un segment ;
  • fetch : charger (fetching) les pages d'un segment ;
  • dump : vider les pages d'un segment ;
  • index : exécuter l'indexeur sur un segment ;
  • merge : fusionner plusieurs index de segments ;
  • dedup : enlever les éléments dupliqués d'un ensemble d'index de segments ;
  • updatedb : mettre à jour la base de données relativement à un segment ;
  • mergesegs : fusionner plusieurs segments ;
  • readdb : examine des champs de la base de données arbitrairement ;
  • analyze : ajuste le scoring de lien de la base de données ;
  • server : exécute un serveur de recherche.

Il n'y a pas de commentaire sur cette page. [Afficher commentaires/formulaire]