Indexerstellung für mehrere eigene Seiten und weitere Fragen

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

Indexerstellung für mehrere eigene Seiten und weitere Fragen

Beitragvon carlo » Di Jul 13, 2010 9:20 am

Hallo,

ich habe mir gestern abend Yacy installiert und unter "Indexerstellung" -> "Von Datei" (Exports der Bookmarks und History) und "Von URL" (einfach eine bestimmte URL) mehrfach Dateien angegeben.
Er fing auch an den Index zu erstellen und ich liess ihn über Nacht laufen.

Nachdem er einige Zeit lief, gab ich einen Suchbegriff, der beim abarbeiten der ersten Datei auftreten musste ein, und fand auch Eintraege.
Inzwischen ist er bei der URL angelangt. Nun finde ich Begriffe, die dort erwartet werden koennen, aber nicht mehr die Begriffe aus dem ersten Bereich.

Ist mein Schluss richtig, dass bei jedem Aufruf von "Indexerstellung" die Indizes des vorherigen Laufes verworfen werden oder muss ich davon ausgehen, dass die Indizes akkumuliert werden und das ich nur einen anderen Fehler mache?
Zusaetzlich interesiert mich, was eigentlich grundsaetzlich passiert, wenn ich in der Basiskonfiguration von "Search portal for your own web pages" nach "Intranet Indexing" wechsle. Wird ein evtl. bestehender Index dann auch verworfen?

Eine weitere Frage ist, ob es moeglich ist, yacy auf mehreren Rechner meines lokalen Netzes zu installieren, jeden einzeln eigene Indizes erstellen lassen kann und alle yacys des lokalen Netzes miteinander, lokal, die Indizes austauschen bzw. verwenden lassen kann. Also sozuagen einen lokalen Cluster bilden.

Gruss
Carlo
carlo
 
Beiträge: 1
Registriert: Di Jul 13, 2010 9:06 am

Re: Indexerstellung für mehrere eigene Seiten und weitere Fragen

Beitragvon Copro » Di Jul 13, 2010 8:00 pm

Die Indexerzeugung ist absolut richtig gelaufen und auch die Suchen danach haben geklappt.
Grundsätzlich ist es aber so dass der Index nicht verworfen wird - vor allem nicht nach einem erneuten Aufruf von Indexerstellung.

Man kann auch gezielt den Index nach Worten oder URLs abfragen in der Indexverwaltung: http://localhost:8080/IndexControlRWIs_p.html
Warum die Suche die Ergebnisse nicht anzeigt mag an anderen Einstellungen liegen, aber der Index wird sicher nicht verworfen.

Die Frage was beim Wechsel der Basiskonfiguration von "Search portal for your own web pages" nach "Intranet Indexing" passiert kann ich Dir nicht sicher beantworten.
Ich habe nur im Changelog und auf Twitter gesehen dass eben die neue Funktionalität lokale Dateien, Shares und verteilte Dateisysteme zu crawlen nur in der Intranet Indexierung möglich ist.

Und auch die Erstellung eines eigenen Clusters ist möglich - dazu muss nur die Netzwerk Konfiguration hier http://localhost:8080/ConfigNetwork_p.html angepasst werden.
Ich denke die gewünschte Konfiguration ist der "Öffentlicher Cluster" im Robinson Modus:

Ihr Peer ist Teil eines öffentlichen Clusters innerhalb des YaCy-Netzwerkes.
Indexdaten werden nicht verteilt, aber Remotecrawl-Anfragen werden verteilt und akzeptiert
Suchanfragen werden über alle Peers des Clusters verteilt und von allen Peers des Clusters beantwortet.
Copro
 
Beiträge: 207
Registriert: Do Dez 13, 2007 3:37 am


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron