crawlingFilter -> mustmatch - Revision 5342

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

crawlingFilter -> mustmatch - Revision 5342

Beitragvon tara » Sa Nov 29, 2008 12:07 pm

Eine Frage zur Änderung in Revision 5342. Da ich die Crawls bei mir häufig per wget starte, ist mir aufgefallen, dass es seit Revision 5342 den Parameternamen "crawlingFilter" nicht mehr gibt. Das ganze heißt ja nun mustmatch.

Also wenn ich die Seite tietokone.fi crawlen möchte (und zwar nur die), muss es dann statt

wget --http-user=${USER} --http-passwd=${PW} --no-proxy -O /dev/null "${RECHNER}/WatchCrawler_p.html?crawlingMode=url&crawlin
gURL=http://www.tietokone.fi/&crawlingDepth=1&crawlingFilter=.*www.tietokone.fi.*&crawlingQ=on&indexText=on&i
ndexMedia=on&crawlOrder=off&intention=&crawlingstart="

dann einfach

wget --http-user=${USER} --http-passwd=${PW} --no-proxy -O /dev/null "${RECHNER}/WatchCrawler_p.html?crawlingMode=url&crawlin
gURL=http://www.tietokone.fi/&crawlingDepth=1&mustmatch=.*www.tietokone.fi.*&crawlingQ=on&indexText=on&i
ndexMedia=on&crawlOrder=off&intention=&crawlingstart="

heissen? (${USER} etc sind nur variablen)

Oder muss da noch zwingend range=wide rein? YaCy crawlt hier nämlich Seiten, die ich nicht angegeben habe (remote crawl ist aus) und ich weiss derzeit nicht woher diese URLs kommen.
Danke schon einmal.
tara
 
Beiträge: 41
Registriert: Fr Jan 11, 2008 8:43 pm

Re: crawlingFilter -> mustmatch - Revision 5342

Beitragvon tara » Sa Nov 29, 2008 6:02 pm

[closed] auf einem anderen Peer läuft es wie gewünscht. Warum auch immer. Vielleicht habe ich irgendwo gepennt oder mich vertippt. sorry.
tara
 
Beiträge: 41
Registriert: Fr Jan 11, 2008 8:43 pm


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron