Trenner bei RegEx

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

Trenner bei RegEx

Beitragvon LA_FORGE » Do Feb 17, 2011 8:21 pm

Hallo,

habe einen Must-not-match Filter gesetzt .*post-new.php.* und möchte noch mehrere dazu machen, wie trenne ich die denn voneinander?

Grüße

Stefan
LA_FORGE
 
Beiträge: 557
Registriert: Sa Okt 11, 2008 5:24 pm

Re: Trenner bei RegEx

Beitragvon Lotus » Do Feb 17, 2011 8:38 pm

Mit Gruppen würde ich das machen:
(regex1|regex2)
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: Trenner bei RegEx

Beitragvon LA_FORGE » Do Feb 17, 2011 8:47 pm

Vielen Dank
LA_FORGE
 
Beiträge: 557
Registriert: Sa Okt 11, 2008 5:24 pm

Re: Trenner bei RegEx

Beitragvon LA_FORGE » Fr Nov 18, 2011 8:43 pm

Hallo,

hm jetzt kommt eine InvocationTargetException wenn ich den Crawl Profile Editor aufrufen will (SVN 7986):

Caused by: java.util.regex.PatternSyntaxException: Dangling meta character '*' near index 1
(*.jpg.*|*.gif.*|*.bmp.*|*.png.*)

Hab' ich was falsch gemacht? :D
LA_FORGE
 
Beiträge: 557
Registriert: Sa Okt 11, 2008 5:24 pm

Re: Trenner bei RegEx

Beitragvon Lotus » So Nov 20, 2011 7:29 pm

Der Regex ist auch fehlerhaft. Der Stern der als textueller Stern gemeint ist, muss escaped werden. Oder eine Zeichengruppe davor definiert werden.
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: Trenner bei RegEx

Beitragvon LA_FORGE » Mo Nov 21, 2011 6:00 am

Vielen Dank. Das ist zu hoch für mich :-(

Wie funktioniert das genau, wenn ich diese 4 Auschlüsse als Must-Not-Match Filter for URLs auf der CrawlStartExpert_p.html mit angeben will?
LA_FORGE
 
Beiträge: 557
Registriert: Sa Okt 11, 2008 5:24 pm

Re: Trenner bei RegEx

Beitragvon Lotus » Di Nov 22, 2011 9:03 pm

Ja, könnte etwas schwierig zu verstehen sein. Noch ein Versuch.

.*\.jpg
gibt beispielsweise an, dass alles was auf .jpg endet gefunden wird.
*.jpg ist doppelt falsch, weil * keinen Bezug hat und . als Menge beliebiger Zeichen keine Angabe wie oft es vorkommen soll.
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste

cron