[WONTFIX] SVN 6743 OOME's nach mehreren Stunden Betrieb

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

[WONTFIX] SVN 6743 OOME's nach mehreren Stunden Betrieb

Beitragvon Quix0r » Do Mär 11, 2010 10:53 pm

Nach mehreren Stunden guten Crawlens funktioniert nur noch der Resource-Observer, das Web-Interface und der Proxy. Andere Threads scheinen alle wegen der OOMEs "gestorben" zu sein:

PerformanceGraph021.png
Klinisch toter Peer? ;-)
PerformanceGraph021.png (6.58 KiB) 506-mal betrachtet


Anbei auch ein 100-facher Thread-Dump.

Etwas spaeter mein Wiederbelebungsversuch:
Die Crawler wurden alle von YaCy angehalten. Nachdem ich sie gestartet hatte, kam nur das im Logfile:
Code: Alles auswählen
W 2010/03/11 22:52:16 kelondroRow row not well-formed: rowinstance[0] =  / [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,]
W 2010/03/11 22:52:16 kelondroRow row not well-formed: rowinstance[0] =  / [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,]
W 2010/03/11 22:52:16 kelondroRow row not well-formed: rowinstance[0] =  / [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,]
W 2010/03/11 22:52:16 kelondroRow row not well-formed: rowinstance[0] =  / [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,]
W 2010/03/11 22:52:16 kelondroRow row not well-formed: rowinstance[0] =  / [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,]
W 2010/03/11 22:52:16 kelondroRow row not well-formed: rowinstance[0] =  / [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,]
W 2010/03/11 22:52:16 kelondroRow row not well-formed: rowinstance[0] =  / [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,]
W 2010/03/11 22:52:16 kelondroRow row not well-formed: rowinstance[0] =  / [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,]

Da half dann nur noch ein ./killYACY.sh :( :( :(
Zuletzt geändert von Quix0r am Di Mär 16, 2010 2:53 am, insgesamt 2-mal geändert.
Quix0r
 
Beiträge: 1345
Registriert: Di Jul 31, 2007 9:22 am
Wohnort: Krefeld

Re: SVN 6743 OOME's nach mehreren Stunden Betrieb

Beitragvon Quix0r » Do Mär 11, 2010 11:42 pm

Nun startet Revision 6744 nicht mehr:
Code: Alles auswählen
I 2010/03/11 23:40:18 TABLE initializing RAM index for TABLE urlNoticeCoreStack9.db, please wait.
W 2010/03/11 23:40:30 Table removing not well-formed entry 1108702 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 0/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1108703 with key: [101, 115, 116, 97, 97, 110, 0, 0, 0, 0, 0, 0,], 1/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1108965 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 2/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1108785 with key: [114, 101, 115, 115, 105, 101, 32, 105, 115, 32, 111, 111,], 3/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109026 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 4/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1108732 with key: [32, 118, 97, 110, 32, 66, 114, 105, 116, 115, 32, 118,], 5/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109171 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 6/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1108777 with key: [116, 32, 40, 100, 101, 101, 108, 115, 41, 32, 97, 102,], 7/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109194 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 8/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109250 with key: [32, 65, 112, 112, 108, 101, 116, 111, 110, 46, 0, 0,], 9/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109374 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 10/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109002 with key: [32, 47, 32, 76, 105, 109, 105, 116, 101, 100, 32, 69,], 11/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109429 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 12/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1108739 with key: [121, 32, 117, 110, 105, 116, 32, 104, 97, 115, 32, 97,], 13/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109502 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 14/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109037 with key: [114, 121, 32, 111, 102, 46, 46, 46, 0, 0, 0, 0,], 15/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109518 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 16/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109151 with key: [99, 97, 110, 32, 97, 46, 46, 46, 0, 0, 0, 0,], 17/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109522 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 18/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109449 with key: [107, 111, 110, 32, 117, 110, 100, 32, 72, 111, 102, 32,], 19/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109524 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 20/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109468 with key: [111, 104, 110, 117, 110, 103, 0, 0, 0, 0, 0, 0,], 21/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109538 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 22/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109511 with key: [117, 115, 104, -17, -65, -67, 108, 102, 116, 101, 32, 105,], 23/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109570 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 24/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109249 with key: [78, 101, 119, 116, 32, 71, 105, 110, 103, 114, 105, 99,], 25/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109581 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 26/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109159 with key: [32, 77, 101, 104, 114, 102, 97, 109, 105, 108, 105, 101,], 27/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109593 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 28/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109478 with key: [100, 115, 116, -17, -65, -67, 99, 107, 0, 0, 0, 0,], 29/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109594 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 30/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1108984 with key: [32, -30, -128, -104, 98, 108, 117, 110, 100, 101, 114, 115,], 31/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109606 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 32/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109567 with key: [111, 103, 97, 110, 103, 32, 97, 117, 102, 32, 49, 48,], 33/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109612 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 34/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109405 with key: [101, 108, 105, 101, 98, 104, 97, 98, 101, 114, 32, 45,], 35/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109614 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 36/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1108719 with key: [111, 109, 32, 101, 114, 32, 118, 111, 111, 114, 32, 116,], 37/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109617 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 38/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109580 with key: [116, -17, -65, -67, 99, 107, 32, 45, 32, 102, 97, 105,], 39/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109622 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 40/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109465 with key: [110, 115, 104, 111, 111, 112, 32, 45, 32, 110, 117, 114,], 41/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109624 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 42/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109551 with key: [70, 65, 77, 73, 76, 73, 69, 0, 0, 0, 0, 0,], 43/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109673 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 44/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109015 with key: [32, 39, 101, 109, 32, 46, 46, 46, 0, 0, 0, 0,], 45/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109646 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 46/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109021 with key: [101, 110, 32, 105, 102, 46, 46, 46, 0, 0, 0, 0,], 47/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109682 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 48/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109616 with key: [101, 114, 110, 32, 86, 105, 108, 108, 97, 33, 0, 0,], 49/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109683 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 50/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109577 with key: [-65, -67, 104, 101, 41, 0, 0, 0, 0, 0, 0, 0,], 51/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109651 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 52/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1108721 with key: [101, 100, 101, 114, 108, 97, 110, 100, 0, 0, 0, 0,], 53/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109654 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 54/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109626 with key: [110, 97, 101, 104, 101, 32, 45, 32, 71, 111, 108, 102,], 55/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109657 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 56/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1108784 with key: [118, 114, 111, 117, 119, 0, 0, 0, 0, 0, 0, 0,], 57/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109689 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 58/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109555 with key: [105, 108, 108, 97, 32, 97, 109, 32, 83, 101, 101, 32,], 59/1066
W 2010/03/11 23:40:32 Table removing not well-formed entry 1109693 with key: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,], 60/1066
E 2010/03/11 23:40:32 STARTUP FATAL ERROR: kelondroBufferedEcoFS.put(1109693) outside bounds (1109691)
java.lang.IndexOutOfBoundsException: kelondroBufferedEcoFS.put(1109693) outside bounds (1109691)
        at net.yacy.kelondro.io.BufferedRecords.put(BufferedRecords.java:109)
        at net.yacy.kelondro.table.Table.removeInFile(Table.java:543)
        at net.yacy.kelondro.table.Table.<init>(Table.java:202)
        at de.anomic.crawler.Balancer.<init>(Balancer.java:82)
        at de.anomic.crawler.NoticedURL.<init>(NoticedURL.java:60)
        at de.anomic.crawler.CrawlQueues.<init>(CrawlQueues.java:77)
        at de.anomic.search.Switchboard.<init>(Switchboard.java:478)
        at net.yacy.yacy.startup(yacy.java:221)
        at net.yacy.yacy.main(yacy.java:1029)
S 2010/03/11 23:40:32 SHUTDOWN goodbye. (this is the last line)
Quix0r
 
Beiträge: 1345
Registriert: Di Jul 31, 2007 9:22 am
Wohnort: Krefeld

Re: SVN 6743 OOME's nach mehreren Stunden Betrieb

Beitragvon dulcedo » Fr Mär 12, 2010 3:37 am

Die so bemängelten tabellen musst du löschen da durch den kill defekt (siehe u.a. viewtopic.php?f=6&t=959&p=7976&hilit=outside+of+bounds#p7976).

Hauptsächlich aus diesem Grund halte ich ein optionales kill innerhalb der automatischen restarts für nicht praktikabel.
dulcedo
 
Beiträge: 1006
Registriert: Do Okt 16, 2008 6:36 pm
Wohnort: Bei Karlsruhe

Re: SVN 6743 OOME's nach mehreren Stunden Betrieb

Beitragvon Quix0r » Fr Mär 12, 2010 9:18 am

Hmmm, 9 Mio. Links im Global Crawler Queue waeren das. :/ Kann man da nicht wie bei den Blobs versuchen, welche zu retten die noch okay sind?

Ich kann heute den kompletten Datensack (komplettes yacy-Verzeichnis) auf HDD mitbringen dann aber (50 GB Daten gesamt mit HTCACHE eingeschlossen).

Aber viel wichtiger ist: Woher das OOM? Ich hatte 3172MB zugewiesen und YaCy zeigt 1,8GB freien Speicher an. :( Der free-Befehl zeigte noch 50 MB freien RAM + > 9 GB freien Swap an.

Edit: Ich kann auch die kaputte Datei bei mir hochladen, so dass du sie dir bei dir ansehen/testen kannst. Noch bin ich da nicht so tief im Code drinne, dass ich es fixen wuerde. Aber mein Ansatz dazu waere:

1.) Die explizite IndexOutOfBoundsException fangen (nicht *die* Exception!!!! Die ist generic und sollte nicht gefangen werden)
2.) Dort eine (neue) recoverTable()-Methode aufrufen, dabei IOException fangen, falls was schief laeuft, dann aber wirklich den Table loeschen.
3.) Den Recovery in eine temporaere .db-Datei starten, dabei versuchen, alle Eintraege als URLs (?) zu lesen und sollte dies nicht gehen (wegen der expliziten Exception) dann diese innerhalb der recoverTable()-Methode fangen und ueberspringen -> Loggen nicht vergessen!
4.) Nachdem das Recovery abgeschlossen ist, die temporaere .db-Datei zurueckkopieren auf die originale
5.) Die temp. loeschen und die wiederhergestellte erneut einlesen (dauert zwar etwas, ist aber besser/sauberer so).
Quix0r
 
Beiträge: 1345
Registriert: Di Jul 31, 2007 9:22 am
Wohnort: Krefeld

Re: SVN 6743 OOME's nach mehreren Stunden Betrieb

Beitragvon dulcedo » Fr Mär 12, 2010 12:22 pm

Wenn es nur Arbeitsdaten sind würde ich das als verschmerzbar bezeichnen und keinen solchen Aufwand betreiben, einen crawl muss man ja enur nochmals starten. Ärgerlicher ist es wie schon einige male passiert bei schon indexierten Dokumenten. Ich verwende kills nur noch wenn ich dabei log und geöffnete Dateien beobachten kann, bei einer Automatik wüsste ich keinen Weg solche Fehler zu vermeiden.
dulcedo
 
Beiträge: 1006
Registriert: Do Okt 16, 2008 6:36 pm
Wohnort: Bei Karlsruhe

Re: SVN 6743 OOME's nach mehreren Stunden Betrieb

Beitragvon Quix0r » Mo Mär 15, 2010 10:55 pm

Wieso Aufwand? YaCy ist GNU GPL 2. :)

Und: Jedes moderne Datenbanksystem hat Recovery, wieso YaCy's Datenbanksystem nicht? Versuch das mal den Usern am Messestand zu erklaeren... :shock:
Quix0r
 
Beiträge: 1345
Registriert: Di Jul 31, 2007 9:22 am
Wohnort: Krefeld

Re: SVN 6743 OOME's nach mehreren Stunden Betrieb

Beitragvon Quix0r » Di Mär 16, 2010 2:33 am

Ich habe nun schweren Herzens (funktionierendes Recovery + weniger Spagetti-Code waere besser) und nach mehreren Stunden bastelns am Java-Code aufgegeben und die besagte defekte Datei geloescht. Sicher ist dies keine Loesung, der Code muesste dringenst vom Spagetti befreit werden und sauberer/mehr gekapselt werden. :(
Quix0r
 
Beiträge: 1345
Registriert: Di Jul 31, 2007 9:22 am
Wohnort: Krefeld

Re: SVN 6743 OOME's nach mehreren Stunden Betrieb

Beitragvon dulcedo » Mi Mär 17, 2010 7:30 am

Quix0r hat geschrieben:Und: Jedes moderne Datenbanksystem hat Recovery, wieso YaCy's Datenbanksystem nicht? Versuch das mal den Usern am Messestand zu erklaeren... :shock:

YaCy ist kostenlos; Versuche das mal einem Standbetreiber zu erklären dem du einen YaCy-Index über 10mio Webdokumente auf deinem Netbook vorführst, während er dir seine ebenso leistungsfähige 25TE Software und den zugehörigen Hochleitungsrechner anpreist.

Wer solche Fetaures braucht kann sie implementieren, dass es nicht einfach ist hast du ja gemerkt ;-)
dulcedo
 
Beiträge: 1006
Registriert: Do Okt 16, 2008 6:36 pm
Wohnort: Bei Karlsruhe

Re: [WONTFIX] SVN 6743 OOME's nach mehreren Stunden Betrieb

Beitragvon Quix0r » Mi Mär 17, 2010 4:03 pm

Dann sollte der Code-Teil rausgeworfen und neu aufgesetzt werden. Die Linux-Programmierer z.B. wollen auch nicht ewig den selben (schwer wartbaren) Code bugfixen, es muss funktionieren.
Quix0r
 
Beiträge: 1345
Registriert: Di Jul 31, 2007 9:22 am
Wohnort: Krefeld


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron