Seite 1 von 1

Kleine Fragen für den Wiedereinstieg

BeitragVerfasst: Sa Dez 03, 2011 5:53 pm
von Seitenreiter
Hi, wie gesagt ich war länger nicht mehr hier, habe jetzt durch den heise Artikel wieder mal einen Versuch unternommen und bin angenehm überrascht. Dennoch hab ich ein paar kleine Fragen, wäre nett wenn mir jemand die bitte beantworten könnte.

Wie kann man Firefox Bookmarks so importieren, dass er die hinterlegten Seiten auch indiziert? Wie kann man plain TXT Listen mit URLs importieren?
Wo wird die Bewertung der Webseite (bei den Suchergebnissen) gespeichert? Lokal oder im Netz?
Es scheint jetzt eine recht klare API zu geben, ist Core und UI nun komplett getrennt?
<s>Ich habe immer nur so ~20PPM obwohl ich 4GB RAM reserviert habe. Was mache ich denn falsch?</s>

Re: Kleine Fragen für den Wiedereinstieg

BeitragVerfasst: So Dez 04, 2011 1:05 am
von Orbiter
Hallihallo willkommen!

nur kurz hierzu:
Seitenreiter hat geschrieben:Wie kann man Firefox Bookmarks so importieren, dass er die hinterlegten Seiten auch indiziert?

das geht seit svn 8134!!!

Re: Kleine Fragen für den Wiedereinstieg

BeitragVerfasst: So Dez 04, 2011 8:26 am
von Seitenreiter
Jups gerade gemacht. Habe 80.000 Links aus OpenStreetMap DE extrahiert. Kann ich die auch als TXT irgendwo reinladen?

Re: Kleine Fragen für den Wiedereinstieg

BeitragVerfasst: So Dez 04, 2011 8:29 pm
von Lotus
Was hast du mit den 80000 Links vor? Crawl Start Expert aus Dateiquelle? Dann besser in weniger Links pro Datei spalten und nacheinander crawlen, dann werden die Warteschlangen nicht so lang.

Seitenreiter hat geschrieben:Wo wird die Bewertung der Webseite (bei den Suchergebnissen) gespeichert? Lokal oder im Netz?

Das wird auch im Netz verbreitet und dann auf http://localhost:8090/Surftips.html?display=1 angezeigt. Mehr passiert da momentan noch nicht.

20PPM liegt wahrscheinlich daran, dass YaCy langsame Ziele gezielt weniger stark crawlt, und einzelne Domänen ebenfalls.