frutch [wiki]:BoiteAIdees

Développement de TagLib? Nutch afin de faciliter la customisation de l'interface de recherche.
Création de scripts de crawl/indexation (et documentation)

Définir un format de document pivot pour l'entrée de l'indexation (voir ParseSchemaProposal).
Définir un parser xml générique utilisant des feuilles de style pour générer les documents pivots (voir ParseXmlProposal).
Un parser XML générique a été développé. Il utilise des namespaces et XPATH pour indexer des documents XML. Voir (http://issues.apache.org/jira/browse/NUTCH-185?page=all)

Il y a un commentaire sur cette page. [Afficher commentaires/formulaire]

frutch [wiki]