Crawl nur auf xpath

Keine Scheu, hier darf alles gefragt und diskutiert werden. Das ist das Forum für YaCy-Anfänger. Hier kann man 'wo muss man klicken' fragen und sich über Grundlagen zur Suchmaschinentechnik unterhalten.
Forumsregeln
Hier werden Fragen beantwortet und wir versuchen die Probleme von YaCy-Newbies zu klären. Bitte beantwortete Fragen im YaCy-Wiki http://wiki.yacy.de dokumentieren!

Crawl nur auf xpath

Beitragvon stbc » Do Mai 25, 2017 7:53 pm

Ahoi

Ich würde Yacy gerne für eine Art Intranetsuche verwenden und bin sehr angetan von der Software. Nun ist es so, dass als zu indizierenden Seiten eine einheitliches DOM aufweisen und ich daher sehr gut die Bereiche mit dem eigentlichen Content per XPath identifizieren kann. Ich brauche die Indizierung von Navigation usw nicht, das verhagelt mir hinterher nur das Ergebnis. Geht das? Also den Crawler auf nen bestimmten XPath trimmen?

Dahin und Gruß
stbc
 
Beiträge: 1
Registriert: Do Mai 25, 2017 7:50 pm

Re: Crawl nur auf xpath

Beitragvon ircamb » Mo Sep 11, 2017 2:49 am

would you please add a few more details about what you are trying to index? I'm not sure what you are trying to trim.

It is possible to trim/only include certain keywords and locations in page.
ircamb
 
Beiträge: 10
Registriert: Mo Sep 11, 2017 1:00 am


Zurück zu Hilfe für Einsteiger und Anwender

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste

cron