PatternSyntaxException

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

PatternSyntaxException

Beitragvon LA_FORGE » Do Jun 16, 2011 6:59 pm

Bei der v0.99/7773 bekomme ich jetzt

Code: Alles auswählen
request: GET http://localpeer/CrawlProfileEditor_p.html

500 Internal Server Error

Unexpected error while processing query.
Session: Session_10.130.201.132:51470#0
Query: /CrawlProfileEditor_p.html
Client: 10.130.201.132
Reason: null

Exception occurred: java.lang.reflect.InvocationTargetException

TRACE:
      java.lang.reflect.InvocationTargetException
   at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
   at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
   at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
   at java.lang.reflect.Method.invoke(Method.java:597)
   at de.anomic.http.server.HTTPDFileHandler.invokeServlet(HTTPDFileHandler.java:1262)
   at de.anomic.http.server.HTTPDFileHandler.doResponse(HTTPDFileHandler.java:844)
   at de.anomic.http.server.HTTPDFileHandler.doGet(HTTPDFileHandler.java:240)
   at de.anomic.http.server.HTTPDemon.GET(HTTPDemon.java:396)
   at sun.reflect.GeneratedMethodAccessor18.invoke(Unknown Source)
   at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
   at java.lang.reflect.Method.invoke(Method.java:597)
   at de.anomic.server.serverCore$Session.listen(serverCore.java:755)
   at de.anomic.server.serverCore$Session.run(serverCore.java:652)
Caused by: java.util.regex.PatternSyntaxException: Unmatched closing ')' near index 28887
http://www.keyword.eruca.jp.*|http://www.de.james-camerons-avatar.wikia.com.*|http://www.microcenter.com.*|http://sesucicintasyuhada.blogspot.com.*|http://www.museumladin.it.*|http://www.bossip.files.wordpress.com.*|http://www.bbs.theithome.com.*|http://rongleason.blogspot.com.*|http://khairulryezal.blogspot.com.*|http://profile.usgs.gov.*|https://www.www2.bc.edu.*|http://www.wardonwords.blogspot.com.*|http://www.tastethedream.com.*|http://affordableecommercewebdesignservices.wordpress.com.*|http://www.whattheduck.net.*|http://three-seventeen.blogspot.com.*|http://www.gadling.com.*|http://www.nikiwithissues.tumblr.com.*|http://getglue.com.*|http://www.veggienights.wordpress.com.*|http://adserver.adtech.de.*|http://www.xml-sitemaps.com.*                                                                                                                                                                                                       
        at java.util.regex.Pattern.error(Pattern.java:1713)
   at java.util.regex.Pattern.compile(Pattern.java:1464)
   at java.util.regex.Pattern.(Pattern.java:1133)
   at java.util.regex.Pattern.compile(Pattern.java:823)
   at de.anomic.crawler.CrawlProfile.mustMatchPattern(CrawlProfile.java:139)
   at CrawlProfileEditor_p.putProfileEntry(CrawlProfileEditor_p.java:243)
   at CrawlProfileEditor_p.respond(CrawlProfileEditor_p.java:186)
   ... 13 more


neuerdings so einen Fehler, hatte den Crawl vorher aus einer HTML-konformen Liste gestartet. Was ist denn da los?
LA_FORGE
 
Beiträge: 559
Registriert: Sa Okt 11, 2008 5:24 pm

Re: 0.99/7509: NullPointerException

Beitragvon Lotus » Do Jun 16, 2011 8:30 pm

Es scheint hier ein generiertes must-match Pattern fehlerhaft zu sein. Die betreffende Code-Datei wurde inzwischen geupdated. Wenn das Problem mit der neuesten Version noch auftritt wäre die Quelldatei mit den Links hilfreich. Es sieht ganz so aus, als ob der Fehler nur durch Debuggen auffindbar ist.
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: 0.99/7509: NullPointerException

Beitragvon LA_FORGE » Sa Jun 18, 2011 4:40 pm

Auf welche SVN soll ich updaten? Müsste unbedingt auf die Crawl Profile Editor Seite um festzustellen um welches HTML-File es sich handelt, hatte den Crawler nämlich mit mehreren HTML-Files gefüttert :-) Sobald ich das File gefunden habe lade ich es für euch hoch zum analysieren.
LA_FORGE
 
Beiträge: 559
Registriert: Sa Okt 11, 2008 5:24 pm

Re: 0.99/7509: NullPointerException

Beitragvon LA_FORGE » Sa Jun 18, 2011 4:52 pm

YEAH hab' mal meine grauen Zellen etwas angestrengt und das File auch ohne den Crawl Profile Editor ausfindig machen können. Ich habe es mal hier für euch hochgeladen.
LA_FORGE
 
Beiträge: 559
Registriert: Sa Okt 11, 2008 5:24 pm

Re: 0.99/7509: NullPointerException

Beitragvon LA_FORGE » Sa Jun 18, 2011 10:39 pm

Lotus hat geschrieben:Es scheint hier ein generiertes must-match Pattern fehlerhaft zu sein. Die betreffende Code-Datei wurde inzwischen geupdated. Wenn das Problem mit der neuesten Version noch auftritt wäre die Quelldatei mit den Links hilfreich. Es sieht ganz so aus, als ob der Fehler nur durch Debuggen auffindbar ist.


Bei der SVN 7781 kommt auch InvocationTargetException wenn ich die 'CrawlProfileEditor_p.html' aufrufen will :-(
LA_FORGE
 
Beiträge: 559
Registriert: Sa Okt 11, 2008 5:24 pm

Re: 0.99/7509: NullPointerException

Beitragvon LA_FORGE » Sa Jun 18, 2011 10:42 pm

Auszug aus dem Log:

Code: Alles auswählen
E 2011/06/18 23:33:05 FILEHANDLER INTERNAL ERROR: java.lang.reflect.InvocationTargetException:null target exception at /mnt/826gb/yacy/htroot/CrawlProfileEditor_p.class: java.util.regex.PatternSyntaxException: Unmatched closing ')' near index 28887
   ^:Unmatched closing ')' near index 28887
   ^
java.lang.reflect.InvocationTargetException
   at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
   at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
   at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
   at java.lang.reflect.Method.invoke(Method.java:597)
   at de.anomic.http.server.HTTPDFileHandler.invokeServlet(HTTPDFileHandler.java:1262)
   at de.anomic.http.server.HTTPDFileHandler.doResponse(HTTPDFileHandler.java:844)
   at de.anomic.http.server.HTTPDFileHandler.doGet(HTTPDFileHandler.java:240)
   at de.anomic.http.server.HTTPDemon.GET(HTTPDemon.java:396)
   at sun.reflect.GeneratedMethodAccessor22.invoke(Unknown Source)
   at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
   at java.lang.reflect.Method.invoke(Method.java:597)
   at de.anomic.server.serverCore$Session.listen(serverCore.java:755)
   at de.anomic.server.serverCore$Session.run(serverCore.java:652)
Caused by: java.util.regex.PatternSyntaxException: Unmatched closing ')' near index 28887
   ^
   at java.util.regex.Pattern.error(Pattern.java:1713)
   at java.util.regex.Pattern.compile(Pattern.java:1464)
   at java.util.regex.Pattern.<init>(Pattern.java:1133)
   at java.util.regex.Pattern.compile(Pattern.java:823)
   at de.anomic.crawler.CrawlProfile.mustMatchPattern(CrawlProfile.java:140)
   at CrawlProfileEditor_p.putProfileEntry(CrawlProfileEditor_p.java:243)
   at CrawlProfileEditor_p.respond(CrawlProfileEditor_p.java:186)
   ... 13 more


Anmerkung: Wird wohl das Selbe sein wie auf der Fehlerseite wenn ich die 'CrawlProfileEditor_p.class' aufrufe. Außerdem werden da die ganzen URLs gelistet im LOG. Die hab ich rausgeschmissen, sonst wär der Post zu lang geworden :-) Kann ich sonst noch irgendwie helfen? Programmieren kann ich leider überhaupt nicht :-( Außer Batch und ein Bißchen Linux Shellscript *g*
LA_FORGE
 
Beiträge: 559
Registriert: Sa Okt 11, 2008 5:24 pm

Re: PatternSyntaxException

Beitragvon LA_FORGE » Do Jun 23, 2011 1:34 pm

Kann ich Crawls die ich 'from File' gestartet habe auch irgendwie anders killen als mit dem Crawl Profile Editor? Dann könnte ich den Crawl der den Fehler verursacht ja einfach abschießen.
LA_FORGE
 
Beiträge: 559
Registriert: Sa Okt 11, 2008 5:24 pm

Re: PatternSyntaxException

Beitragvon Lotus » Do Jun 23, 2011 3:27 pm

Unter /DATA/INDEX/freeworld/QUEUES kann man die Dateien crawlProfiles* löschen.
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: PatternSyntaxException

Beitragvon LA_FORGE » Do Jun 23, 2011 4:58 pm

Danke
LA_FORGE
 
Beiträge: 559
Registriert: Sa Okt 11, 2008 5:24 pm

Re: PatternSyntaxException

Beitragvon LA_FORGE » Fr Jun 24, 2011 2:01 pm

Jetzt kommt

request: GET http://localpeer/CrawlProfileEditor_p.html

500 Internal Server Error

Unexpected error while processing query.
Session: Session_10.130.201.132:61234#0
Query: /CrawlProfileEditor_p.html
Client: 10.130.201.132
Reason: null

Exception occurred: java.lang.reflect.InvocationTargetException

TRACE:
java.lang.reflect.InvocationTargetException
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
at java.lang.reflect.Method.invoke(Method.java:597)
at de.anomic.http.server.HTTPDFileHandler.invokeServlet(HTTPDFileHandler.java:1261)
at de.anomic.http.server.HTTPDFileHandler.doResponse(HTTPDFileHandler.java:843)
at de.anomic.http.server.HTTPDFileHandler.doGet(HTTPDFileHandler.java:239)
at de.anomic.http.server.HTTPDemon.GET(HTTPDemon.java:396)
at sun.reflect.GeneratedMethodAccessor11.invoke(Unknown Source)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
at java.lang.reflect.Method.invoke(Method.java:597)
at de.anomic.server.serverCore$Session.listen(serverCore.java:755)
at de.anomic.server.serverCore$Session.run(serverCore.java:652)
Caused by: java.lang.NullPointerException
at CrawlProfileEditor_p.respond(CrawlProfileEditor_p.java:137)
... 13 more


Könnt ihr bitte bitte demnächst den PatternSyntaxException Bug fixen?
LA_FORGE
 
Beiträge: 559
Registriert: Sa Okt 11, 2008 5:24 pm

Re: PatternSyntaxException

Beitragvon Low012 » Sa Jun 25, 2011 11:19 am

Probier mal Revision 7799. Ich habe da eine kleine Änderung vorgenommen, die zumindest die NullPointerException verhindert, die die Exception aus dem geposteten Stacktrace verursacht hat.
Low012
 
Beiträge: 2214
Registriert: Mi Jun 27, 2007 12:11 pm

Re: PatternSyntaxException

Beitragvon LA_FORGE » So Jun 26, 2011 3:33 pm

Vielen Dank. Hab die 7799 mal eingespielt. Jetzt kommt

Code: Alles auswählen
request: GET http://localpeer/CrawlProfileEditor_p.html

500 Internal Server Error

Unexpected error while processing query.
Session: Session_93.195.98.196:64100#0
Query: /CrawlProfileEditor_p.html
Client: 93.195.98.196
Reason: null

Exception occurred: java.lang.reflect.InvocationTargetException

TRACE:
      java.lang.reflect.InvocationTargetException
   at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
   at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
   at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
   at java.lang.reflect.Method.invoke(Method.java:597)
   at de.anomic.http.server.HTTPDFileHandler.invokeServlet(HTTPDFileHandler.java:1261)
   at de.anomic.http.server.HTTPDFileHandler.doResponse(HTTPDFileHandler.java:843)
   at de.anomic.http.server.HTTPDFileHandler.doGet(HTTPDFileHandler.java:239)
   at de.anomic.http.server.HTTPDemon.GET(HTTPDemon.java:396)
   at sun.reflect.GeneratedMethodAccessor3.invoke(Unknown Source)
   at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
   at java.lang.reflect.Method.invoke(Method.java:597)
   at de.anomic.server.serverCore$Session.listen(serverCore.java:755)
   at de.anomic.server.serverCore$Session.run(serverCore.java:652)
Caused by: java.lang.NullPointerException
   at CrawlProfileEditor_p.putProfileEntry(CrawlProfileEditor_p.java:237)
   at CrawlProfileEditor_p.respond(CrawlProfileEditor_p.java:188)
   ... 13 more


Wenn ich den Crawl Profile Editor aufrufen will
LA_FORGE
 
Beiträge: 559
Registriert: Sa Okt 11, 2008 5:24 pm

Re: PatternSyntaxException

Beitragvon Low012 » Mo Jun 27, 2011 12:27 pm

Hallo La Forge,

ich bin dran, habe es nur gestern Abend nicht geschafft, es fertig zu machen. (YaCy startet bei mir jetzt gar nicht mehr. Hö! Hö!) Ich schaue mir mal den kompletten Pfad von der Eingabe des Filters, über Speicherung und erneutes Laden bis hin zur Ausgabe, beziehungsweise Benutzung an. Das dauert ein bisschen, ist aber meines Erachtens der einzig saubere Weg.

Die letzte Änderung habe ich nur oberflächlich gemacht, weil ich Samstag nicht viel Zeit hatte. Es kann noch ein paar Tage dauern, bis ich fertig bin, weil ich diese Woche beruflich etwas stärker eingebunden bin als sonst.

Wenn sonst noch jemand an der Sache dran ist, bitte Bescheid sagen, dann könnte ich mir ein bisschen Stress ersparen. ;)
Low012
 
Beiträge: 2214
Registriert: Mi Jun 27, 2007 12:11 pm

Re: PatternSyntaxException

Beitragvon LA_FORGE » Mo Jun 27, 2011 5:29 pm

Vielen Herzlichen Dank!!
LA_FORGE
 
Beiträge: 559
Registriert: Sa Okt 11, 2008 5:24 pm

Re: PatternSyntaxException

Beitragvon LA_FORGE » So Jul 03, 2011 9:50 am

Low012 hat geschrieben:Hallo La Forge,

ich bin dran, habe es nur gestern Abend nicht geschafft, es fertig zu machen. (YaCy startet bei mir jetzt gar nicht mehr. Hö! Hö!) Ich schaue mir mal den kompletten Pfad von der Eingabe des Filters, über Speicherung und erneutes Laden bis hin zur Ausgabe, beziehungsweise Benutzung an. Das dauert ein bisschen, ist aber meines Erachtens der einzig saubere Weg.

Die letzte Änderung habe ich nur oberflächlich gemacht, weil ich Samstag nicht viel Zeit hatte. Es kann noch ein paar Tage dauern, bis ich fertig bin, weil ich diese Woche beruflich etwas stärker eingebunden bin als sonst.

Wenn sonst noch jemand an der Sache dran ist, bitte Bescheid sagen, dann könnte ich mir ein bisschen Stress ersparen. ;)


Kann evtl. ein Sonderzeichen oder ein Zeichen aus einem asiatischen Zeichensatz den Fehler verursachen? Früher hat es ja einwandfrei funktioniert, aber seitdem ich den Crawl aus dieser HTML-konformen Liste gestartet habe, kommt der Fehler und in dieser Liste sind ne Menge "Sonderzeichen".
LA_FORGE
 
Beiträge: 559
Registriert: Sa Okt 11, 2008 5:24 pm

Re: PatternSyntaxException

Beitragvon Low012 » Mo Jul 04, 2011 1:06 am

Danke für die Datei. Ich habe sie runtergeladen, aber noch nicht ausprobiert. Ich habe eben eine Änderung eingecheckt, die dafür sorgt, dass CrawlProfiles, die ungültige reguläre Ausdrücke enthalten, nicht mehr geladen werden. Sie werden in eine neue Datei geschrieben, die sich DATA/INDEX/freeworld/QUEUES/crawlProfilesInvalid.heap nennt. Ich werde nochmal schauen, dass es keine Möglichkeit gibt, über die YaCy-Weboberfläche illegale Filter zu setzen.

Die Datei crawlProfilesInvalid.heap wird bis jetzt nur mit ungültigen Profilen gefüllt, aber man kann über die Weboberfläche diese Profile weder ansehen, noch bearbeiten. Wenn das notwendig ist, kann ich das aber einbauen.

Ich hoffe, diese Änderung hilft dir erstmal.

Ach ja: Revision 7827
Low012
 
Beiträge: 2214
Registriert: Mi Jun 27, 2007 12:11 pm

Re: PatternSyntaxException

Beitragvon LA_FORGE » Mo Jul 04, 2011 12:36 pm

Super klasse!! Vielen herzlichen Dank!!

Bin gerade am Booten des Peers nach Einspielen des Updates. Bei der Indexgröße (mittlerweile über 100 Mio. Links) wird das allerdings trotz der ultraschnellen SAS-Platten im RAID0 mit 3,3 ms Zugriffszeit über 2 Stunden dauern :D

Code: Alles auswählen
31009 stefan     0 -20 76.7g  30g  10m S  266 31.8   3:14.48 java


77 GB RAM fressender Java-Prozess, das darf man niemandem erzählen :D
LA_FORGE
 
Beiträge: 559
Registriert: Sa Okt 11, 2008 5:24 pm

Re: PatternSyntaxException

Beitragvon LA_FORGE » Mo Jul 04, 2011 8:42 pm

21:39 Uhr jetzt ist mein Peer (endeavour) wieder online. Und der Crawl Profile Editor funktioniert wieder einwandfrei - Hut ab für deine Programmierarbeiten. Respekt!!
LA_FORGE
 
Beiträge: 559
Registriert: Sa Okt 11, 2008 5:24 pm

Re: PatternSyntaxException

Beitragvon Low012 » Di Jul 05, 2011 8:09 am

Weißt du, ob irgendwas in DATA/INDEX/freeworld/QUEUES/crawlProfilesInvalid.heap geschrieben wurde? Wenn ja, brauchst du eine Möglichkeit, diese Einträge zu bearbeiten und wieder zu den aktiven Profilen zu verschieben?
Low012
 
Beiträge: 2214
Registriert: Mi Jun 27, 2007 12:11 pm

Re: PatternSyntaxException

Beitragvon LA_FORGE » Di Jul 05, 2011 1:00 pm

hm.. die Datei hat bei mir 0 Byte. Seit deinem Fix kann ich aber wieder den Crawl Profile Editor aufrufen und alles funktioniert dort einwandfrei. Eine Möglichkeit zur Bearbeitung wäre toll, aber es eilt nicht. Könnt ihr mal mit auf die Roadmap nehmen.

Diesen "Bug" fixen wäre super klasse, da hätten alle was davon.

Ich glaube dass bei vielen Peers in der Community ware Schätze im Scheduled Recrawl liegen. Wenn die dann zum eingestellten Zeitpunkt auch automatisch anlaufen und den Crawl (re)triggern wäre das super. Ich habe bei mir mindestens 20 wertvolle Seiten, die für den globalen Index einen Mehrwert darstellen. Sie haben sich im Laufe der Zeit bei mir angesammelt (Bookmarks) und es wäre eine große Erleichterung für mich, wenn der recrawl wieder automatisiert gestartet wird.

Meine Vermutung ist, dass der neue Scheduler den ihr gebaut habt zwar den Crawl im eingestellten Intervall retriggert, aber der Content des vorherigen Crawls (evtl. auch die Daten im HTCACHE) als zu aktuell markiert sind und der Crawl deshalb nicht wiederholt wird.

Michael hat in dem Thread auch was dazu geschrieben, ist aber zu hoch für mich :-) ich hab leider keine Informatik-Ausbildung und programmieren kann ich erst recht nicht :-( Deshalb bewundere ich das immer was ihr so auf die Beine stellt. Hut ab!!
LA_FORGE
 
Beiträge: 559
Registriert: Sa Okt 11, 2008 5:24 pm

Re: PatternSyntaxException

Beitragvon Low012 » Do Jul 14, 2011 8:26 am

LA_FORGE hat geschrieben:Diesen "Bug" fixen wäre super klasse, da hätten alle was davon.


Habs im Hinterkopf, mir das anzusehen, aber ich weiß nicht, ob ich bis Ende des Monats dazu komme, weil ich zur Zeit mit der Arbeit, für die ich Geld bekomme, ganz gut ausgelastet bin. ;)

Wenn das bis Mitte August immer noch nicht gefixt ist, bitte nicht davor zurückschrecken, mich daran zu erinnern!
Low012
 
Beiträge: 2214
Registriert: Mi Jun 27, 2007 12:11 pm

Re: PatternSyntaxException

Beitragvon LA_FORGE » So Aug 21, 2011 11:06 am

Code: Alles auswählen
I 2011/08/21 11:58:18 APICALL /Crawler_p.html?bookmarkFolder=/crawlStart&crawlingDomMaxPages=10000&intention=&range=wide&recrawl=nodoubles&storeHTCache=on&sitemapURL=&repeat_time=7&crawlingIfOlderUnit=day&cachePolicy=iffresh&indexText=on&crawlingMode=url&crawlingURL=http://www.booksatoz.com/censorship/index.htm&crawlingFile=&bookmarkTitle=&mustnotmatch=&crawlingstart=Start%20New%20Crawl&mustmatch=.*&crawlingIfOlderNumber=7&repeat_unit=seldays&crawlingDepth=3

W 2011/08/21 11:58:20 LOADER HTCACHE contained response header, but not content for url http://www.booksatoz.com/censorship/index.htm

I 2011/08/21 11:58:20 Rejected URL http://www.booksatoz.com/censorship/index.htm - no response body (http return code = 404)


SVN 7882 - Hm was ist denn da los? Wenn ich die Seite im Browser aufrufe funktioniert sie ganz normal und an der robots.txt kann's auch nicht liegen. Das hatte ich auch schon bei einigen anderen Seiten :-(

Viele Grüße

Stefan
LA_FORGE
 
Beiträge: 559
Registriert: Sa Okt 11, 2008 5:24 pm

Re: PatternSyntaxException

Beitragvon LA_FORGE » So Aug 21, 2011 11:09 am

Noch ein Beispiel:

Code: Alles auswählen
I 2011/08/21 12:05:39 APICALL /Crawler_p.html?bookmarkFolder=/crawlStart&crawlingDomMaxPages=10000&intention=&range=wide&recrawl=nodoubles&storeHTCache=on&sitemapURL=&repeat_time=7&crawlingIfOlderUnit=day&cachePolicy=iffresh&indexText=on&crawlingMode=url&crawlingURL=http://www.comesifa.eu&crawlingFile=&bookmarkTitle=&mustnotmatch=&crawlingstart=Start%20New%20Crawl&mustmatch=.*&crawlingIfOlderNumber=7&repeat_unit=seldays&crawlingDepth=3
I 2011/08/21 12:05:40 Rejected URL http://www.comesifa.eu/ - no response body (http return code = 999)
LA_FORGE
 
Beiträge: 559
Registriert: Sa Okt 11, 2008 5:24 pm

Re: PatternSyntaxException

Beitragvon LA_FORGE » Sa Dez 17, 2011 3:05 pm

LA_FORGE hat geschrieben:21:39 Uhr jetzt ist mein Peer (endeavour) wieder online. Und der Crawl Profile Editor funktioniert wieder einwandfrei - Hut ab für deine Programmierarbeiten. Respekt!!


Hm ich hab wieder mal Mist gebaut und kann die Page des Crawl Profile Editors nicht mehr aufrufen:

Code: Alles auswählen
Exception occurred: java.lang.reflect.InvocationTargetException

TRACE:
      java.lang.reflect.InvocationTargetException
   at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
   at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
   at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
   at java.lang.reflect.Method.invoke(Method.java:616)
   at de.anomic.http.server.HTTPDFileHandler.invokeServlet(HTTPDFileHandler.java:1380)
   at de.anomic.http.server.HTTPDFileHandler.doResponse(HTTPDFileHandler.java:929)
   at de.anomic.http.server.HTTPDFileHandler.doGet(HTTPDFileHandler.java:245)
   at de.anomic.http.server.HTTPDemon.GET(HTTPDemon.java:397)
   at sun.reflect.GeneratedMethodAccessor3.invoke(Unknown Source)
   at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
   at java.lang.reflect.Method.invoke(Method.java:616)
   at de.anomic.server.serverCore$Session.listen(serverCore.java:757)
   at de.anomic.server.serverCore$Session.run(serverCore.java:651)
Caused by: java.util.regex.PatternSyntaxException: Dangling meta character '*' near index 1
(*.jpg.*|*.gif.*|*.bmp.*|*.png.*)
^
   at java.util.regex.Pattern.error(Pattern.java:1730)
   at java.util.regex.Pattern.sequence(Pattern.java:1895)
   at java.util.regex.Pattern.expr(Pattern.java:1769)
   at java.util.regex.Pattern.group0(Pattern.java:2547)
   at java.util.regex.Pattern.sequence(Pattern.java:1823)
   at java.util.regex.Pattern.expr(Pattern.java:1769)
   at java.util.regex.Pattern.compile(Pattern.java:1477)
   at java.util.regex.Pattern.(Pattern.java:1150)
   at java.util.regex.Pattern.compile(Pattern.java:840)
   at de.anomic.crawler.CrawlProfile.urlMustNotMatchPattern(CrawlProfile.java:303)
   at CrawlProfileEditor_p.putProfileEntry(CrawlProfileEditor_p.java:256)
   at CrawlProfileEditor_p.respond(CrawlProfileEditor_p.java:198)
   ... 13 more


SVN 1.01/9000 kann das einer der Developer bitte fixen?
LA_FORGE
 
Beiträge: 559
Registriert: Sa Okt 11, 2008 5:24 pm

Re: PatternSyntaxException

Beitragvon LA_FORGE » Sa Dez 17, 2011 8:14 pm

Ich weiß ich habe die RegEx falsch formuliert deshalb kam die Exception aber kannn man den Crawl Profile Editor nicht resistent gegen sowas machen?
LA_FORGE
 
Beiträge: 559
Registriert: Sa Okt 11, 2008 5:24 pm

Re: PatternSyntaxException

Beitragvon Low012 » Di Dez 20, 2011 12:17 pm

Ja, kann man! Es gibt ja auch irgendwo schon eine Methode, die bei der Blacklist-Verwaltung benutzt wird. Ich komme leider im Moment zu nichts, schicke mir aber selber mal einen Link zu diesem Thread, damit ich es nicht vergesse.
Low012
 
Beiträge: 2214
Registriert: Mi Jun 27, 2007 12:11 pm

Re: PatternSyntaxException

Beitragvon LA_FORGE » Do Dez 22, 2011 10:37 pm

Vielen Dank!!
LA_FORGE
 
Beiträge: 559
Registriert: Sa Okt 11, 2008 5:24 pm


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste