Alle TLDs bis auf eine blacklisten

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

Alle TLDs bis auf eine blacklisten

Beitragvon zrsl » So Feb 06, 2011 7:25 pm

Servus
Ich bin grad ein bisschen am verzweifeln. Ich möchte sämtliche URLs aller TopLevelDomains aussperren bis auf eine. Das müsste doch mit dem Regex in der Blockierliste funktionieren:
Code: Alles auswählen
((\w+\.)(?!de).+)

Wenn ich aber die Blacklist bei /BlacklistTest_p.html teste, wendet er nix gegen yacy.net ein. Auch der BlacklistCleaner sagt nix gegen meinen Regex Was mache ich falsch? Ich hab auch schon was über Whitelists gelesen. Aber ich habs bisher nicht geschafft die Blacklist Engine umzustellen.
zrsl
 
Beiträge: 8
Registriert: Di Nov 16, 2010 6:10 pm

Re: Alle TLDs bis auf eine blacklisten

Beitragvon Low012 » So Feb 06, 2011 7:59 pm

Hallo, ich habe vorhin einen Bug in der Blacklistengine gefixt. Versuch es doch mal ein Update deines Peers (auf mindestens Revision 7471).

Ich habe deinen regulären Ausdruck mal bei mir (mit der neuen Version) probiert und ich glaube, es funktioniert zumindest teilweise.

yacy.net wird geblock
heise.de wird nicht geblock
www.heise.de wird geblock

Der reguläre Ausdruck müsste also noch so erweitert werden, dass Subdomains zugelassen werden (wenn das gewollt ist). Außerdem werden (glaube ich) Domains mit "-" (z.B. yacy-websuche.de) nicht berücksichtigt werden. Ich habe aber eben auf die Schnelle keinen regulären Ausdruck zusammengebastelt bekommen, der das erfüllt, was ich mir denke, was du willst.
Low012
 
Beiträge: 2214
Registriert: Mi Jun 27, 2007 12:11 pm

Re: Alle TLDs bis auf eine blacklisten

Beitragvon zrsl » So Feb 06, 2011 8:32 pm

danke für den Bugfix :-) . funktioniert jetzt nachdem ich geupdatet habe.
Code: Alles auswählen
   ((.+\.)(?!de).+)/.*

das ist jetzt meine regex.
zrsl
 
Beiträge: 8
Registriert: Di Nov 16, 2010 6:10 pm


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste

cron