Problem beim URL Export / Nur teilweiser Export

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

Problem beim URL Export / Nur teilweiser Export

Beitragvon yayu » Mi Okt 17, 2012 3:15 pm

Hallo zusammen!

Bin neu hier und konnte bis jetzt durch Suchen alle meine Fragen klären. Aber eine Sache will mir nicht in den Kopf:

Ich möchte URLs in eine Datei exportieren und hierfür gibt es ja unter IndexControlURLs_p.html die Export-Funktion. Aber wann werden URLs exportiert und wann nicht. Bspw. habe ich den Crawler eine (für meinen Index neue) Seite durchsuchen lassen. Danach versuche ich die gecrawlten URLs zu exportieren. Nur klappt das nicht. Hab Yacy auch schon mal 3 Stunden durchlaufen lassen, weil ich vermutet habe, dass der Aufbau des Index länger dauert. Aber das brachte alles keinen Erfolg.

Ich hab jetzt knapp 22.000 URLs in meinem Index. Wenn ich per .*.* alle exportieren will, wird nur ein Teil exportiert. Und auch nicht immer die gleiche Anzahl.
4 Versuche hintereinander brachten folgende Ergebnisse: 16.160, 16.560, 14.330 und 12580.

Warum macht Yacy das und wie kann ich das unterbinden? Gibt es vielleicht eine bessere Variante für den URL-Export?

Vielen, vielen Dank schon mal im vorraus falls mir jemand helfen kann.
yayu
 
Beiträge: 2
Registriert: Mi Okt 17, 2012 3:08 pm

Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste