Problem nach Index löschen SVN 7724

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

Problem nach Index löschen SVN 7724

Beitragvon henschi » So Jul 03, 2011 5:55 pm

Wenn ich den meinen Index komplett lösche und danach einen neuen Crawler starte wird nichts indiziert. Es wird nur diese Meldung not pushed: double occurrence in double_push_check pro gefundener HTML Seite ins Log geschrieben. Wenn ich nach dem Index löschen Yacy neu starte passiert das nicht. Das komplette Log nach dem Löschen ist anbei.
I 2011/07/03 18:45:58 NoticedURL CLEARING ALL STACKS
I 2011/07/03 18:45:58 Balancer cleaning balancer with 0 entries from /opt/yacy/DATA/INDEX/freeworld/QUEUES/urlNoticeCoreStack9.db
I 2011/07/03 18:45:58 Balancer cleaning balancer with 0 entries from /opt/yacy/DATA/INDEX/freeworld/QUEUES/urlNoticeLimitStack9.db
I 2011/07/03 18:45:58 Balancer cleaning balancer with 0 entries from /opt/yacy/DATA/INDEX/freeworld/QUEUES/urlNoticeRemoteStack9.db
I 2011/07/03 18:45:58 Balancer cleaning balancer with 0 entries from /opt/yacy/DATA/INDEX/freeworld/QUEUES/urlNoticeNoLoadStack9.db
I 2011/07/03 18:45:58 Heap clearing heap /opt/yacy/DATA/HTCACHE/responseHeader.heap
I 2011/07/03 18:45:58 Heap clearing heap /opt/yacy/DATA/WORK/robots.bheap
I 2011/07/03 18:45:58 HeapReader generating index for /opt/yacy/DATA/WORK/searchfl.bheap, 0 MB. Please wait.
I 2011/07/03 18:45:58 HeapReader finished index generation for /opt/yacy/DATA/WORK/searchfl.bheap, 0 entries, 0 gaps.
I 2011/07/03 18:45:58 Heap initializing heap /opt/yacy/DATA/WORK/searchfl.bheap
I 2011/07/03 18:45:58 Heap clearing heap /opt/yacy/DATA/WORK/searchfl.bheap
I 2011/07/03 18:45:58 Heap closing heap /opt/yacy/DATA/WORK/searchfl.bheap
I 2011/07/03 18:46:17 HTCACHE storing content of url http://www.eaipatterns.com/, 40531 bytes
I 2011/07/03 18:46:33 APICALL /Crawler_p.html?createBookmark=off&xsstopw=off&crawlingDomMaxPages=10000&intention=&range=domain&indexMedia=on&recrawl=nodoubles&xdstopw=off&storeHTCache=on&sitemapURL=&repeat_time=7&crawlingQ=on&cachePolicy=iffresh&indexText=on&crawlingMode=url&crawlingURL=http://www.eaipatterns.com&bookmarkTitle=Home%20-%20Enterprise%20Integration%20Patterns&mustnotmatch=&crawlingDomFilterDepth=1&crawlingDomFilterCheck=off&crawlingstart=Start%20New%20Crawl&xpstopw=off&repeat_unit=seldays&crawlingDepth=99
I 2011/07/03 18:46:34 BALANCER re-fill of domain stacks; fileIndex.size() = 1, domainStacks.size = 1, collection time = 1 ms
I 2011/07/03 18:46:35 HTCACHE storing content of url http://www.eaipatterns.com/, 40531 bytes
W 2011/07/03 18:46:35 STACKCRAWL CrawlStacker.stackCrawl of URL http://www.eaipatterns.com/FormatIndicator.html - not pushed: double occurrence in double_push_check
I 2011/07/03 18:46:35 Rejected URL http://www.infoq.com/ - denied_(the url 'http://www.infoq.com/' is not in domainList of this network)
W 2011/07/03 18:46:35 STACKCRAWL CrawlStacker.stackCrawl of URL http://www.eaipatterns.com/MessageExpiration.html - not pushed: double occurrence in double_push_check
W 2011/07/03 18:46:35 STACKCRAWL CrawlStacker.stackCrawl of URL http://www.eaipatterns.com/CorrelationIdentifier.html - not pushed: double occurrence in double_push_check

henschi
 
Beiträge: 65
Registriert: So Okt 07, 2007 6:49 pm
Wohnort: Brandenburg an der Havel

Re: Problem nach Index löschen SVN 7724

Beitragvon Orbiter » Di Jul 05, 2011 6:41 pm

da beim Index Löschen gibts eine menge von zusätzlichen Optionen was man noch löschen kann. Hast du die und hast du die alle an?
Orbiter
 
Beiträge: 5792
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Problem nach Index löschen SVN 7724

Beitragvon henschi » Di Jul 05, 2011 7:30 pm

Ich hatte alle 5 Optionen an. Bis auf die mit dem HTTP und FTP Cache sind doch sogar alle vorbelegt.
Es wird bestimmt nur eine andere interne Liste nicht gelöscht, die zuvor durch einen Crawler gefüllt wurde. :-)
henschi
 
Beiträge: 65
Registriert: So Okt 07, 2007 6:49 pm
Wohnort: Brandenburg an der Havel


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast