Web Crawler liefert bei allen eingaben -UNRESOLVED_PATTERN-

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

Web Crawler liefert bei allen eingaben -UNRESOLVED_PATTERN-

Beitragvon bschatz » So Jul 19, 2009 10:16 pm

Hallo,

Nach einer NeuInstallation ==>
deb http://debian.yacy.net ./

Liefert jeder Versucheinen Crwaler zu starten folgender Fehler (egal welche URL)

Fehler mit URL Eingabe "http://spiegel.de/": -UNRESOLVED_PATTERN-

# aptitude show yacy | grep Version
Version: 0.91svn6173


Gruss
bernd
bschatz
 
Beiträge: 2
Registriert: So Jul 19, 2009 10:08 pm

Re: Web Crawler liefert bei allen eingaben -UNRESOLVED_PATTERN-

Beitragvon bschatz » Mo Jul 20, 2009 9:52 am

Hallo,

Durch entfernen aller Blacklists und restart gelöst.

Gruss
Bernd
bschatz
 
Beiträge: 2
Registriert: So Jul 19, 2009 10:08 pm

Re: Web Crawler liefert bei allen eingaben -UNRESOLVED_PATTERN-

Beitragvon dulcedo » Mo Jul 20, 2009 10:02 am

Das Thema ist ist etwas versteckt, dort ist die Idee gereift ;-)
viewtopic.php?p=16783#p16783

Du kannst aktuelle Entwickerversionen vom deb-package hier bekommen: https://latestyacy.f1ori.de/
Dort sind schon einige Bugs gefixt.
dulcedo
 
Beiträge: 1006
Registriert: Do Okt 16, 2008 6:36 pm
Wohnort: Bei Karlsruhe

Re: Web Crawler liefert bei allen eingaben -UNRESOLVED_PATTERN-

Beitragvon markus » Do Aug 27, 2009 1:58 pm

Hallo,

ich habe yacy frisch installiert und bekomme ebenfalls immer die "-UNRESOLVED_PATTERN-" Fehlermeldung. Da ich keine Blacklists habe, die ich löschen kann - irgendwelche anderen Ideen?

System ist ein Ubuntu Hardy mit Yacy von
deb http://debian.yacy.net ./

Nachtrag:
Habe jetzt mal versucht, ein aktuelleres Paket zu installieren:
aptitude show yacy | grep Version
Version: 0.91svn6267

Nachtrag 2:
Wie es ausschaut, kann ich die Pakete von https://latestyacy.f1ori.de/ gar nicht zum Laufen bekommen. Es erscheinen immer folgende Fehler in
/var/log/yacy/yacy00.log:

S 2009/08/27 16:41:07 STARTUP Operation system: Linux
S 2009/08/27 16:41:07 STARTUP Application root-path: /usr/share/yacy
S 2009/08/27 16:41:07 STARTUP Time zone: UTC+0200; UTC+0000 is 1251384066974
S 2009/08/27 16:41:07 STARTUP Maximum file system path length: 65535
I 2009/08/27 16:41:08 HeapReader generating index for /usr/share/yacy/DATA/INDEX/webportal/NETWORK/seed.new.heap, 0 MB. Please wait.
I 2009/08/27 16:41:08 HeapReader finished index generation for /usr/share/yacy/DATA/INDEX/webportal/NETWORK/seed.new.heap, 0 entries, 0 gaps.
I 2009/08/27 16:41:08 HeapReader generating index for /usr/share/yacy/DATA/INDEX/webportal/NETWORK/seed.old.heap, 0 MB. Please wait.
I 2009/08/27 16:41:08 HeapReader finished index generation for /usr/share/yacy/DATA/INDEX/webportal/NETWORK/seed.old.heap, 10 entries, 0 gaps.
I 2009/08/27 16:41:08 HeapReader generating index for /usr/share/yacy/DATA/INDEX/webportal/NETWORK/seed.pot.heap, 0 MB. Please wait.
I 2009/08/27 16:41:08 HeapReader finished index generation for /usr/share/yacy/DATA/INDEX/webportal/NETWORK/seed.pot.heap, 0 entries, 0 gaps.
I 2009/08/27 16:41:08 TABLE initialization of /usr/share/yacy/DATA/INDEX/webportal/NETWORK/news.db: available RAM: 175MB, allocating space for 0 entries
I 2009/08/27 16:41:08 TABLE /usr/share/yacy/DATA/INDEX/webportal/NETWORK/news.db: TABLE /usr/share/yacy/DATA/INDEX/webportal/NETWORK/news.db has table copy DISABLED
I 2009/08/27 16:41:08 TABLE initializing RAM index for TABLE news.db, please wait.
I 2009/08/27 16:41:08 PLASMA Initializing Segment '/usr/share/yacy/DATA/INDEX/webportal/TEXT', word hash cache size is 18362.
I 2009/08/27 16:41:08 HeapReader generating index for /usr/share/yacy/DATA/INDEX/webportal/TEXT/RICELL/index.20090827124150306.blob, 0 MB. Please wait.
I 2009/08/27 16:41:08 HeapReader finished index generation for /usr/share/yacy/DATA/INDEX/webportal/TEXT/RICELL/index.20090827124150306.blob, 0 entries, 0 gaps.
I 2009/08/27 16:41:08 PLASMA Initializing Word Index for the network 'webportal', word hash cache size is 18362.
I 2009/08/27 16:41:08 HeapReader generating index for /usr/share/yacy/DATA/INDEX/webportal/QUEUES/crawlProfilesActive.heap, 0 MB. Please wait.
I 2009/08/27 16:41:08 HeapReader finished index generation for /usr/share/yacy/DATA/INDEX/webportal/QUEUES/crawlProfilesActive.heap, 4 entries, 1 gaps.
I 2009/08/27 16:41:08 CrawlProfiles loaded Profile EQm4zQoturkm: surrogates
I 2009/08/27 16:41:08 CrawlProfiles loaded Profile LCpaIcgzY-VM: remote
I 2009/08/27 16:41:08 MEMORY performed explicit GC, freed 1622 KB (requested/available/average: 362288 / 182617 / 0 KB)
E 2009/08/27 16:41:08 STARTUP FATAL ERROR: null
java.lang.NullPointerException
at de.anomic.crawler.CrawlProfile.<init>(CrawlProfile.java:65)
at de.anomic.crawler.CrawlSwitchboard.<init>(CrawlSwitchboard.java:93)
at de.anomic.search.Switchboard.<init>(Switchboard.java:354)
at yacy.startup(yacy.java:220)
at yacy.main(yacy.java:1031)
S 2009/08/27 16:41:08 SHUTDOWN goodbye. (this is the last line)


Markus
markus
 
Beiträge: 11
Registriert: Do Aug 27, 2009 1:53 pm


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 4 Gäste