Indizes kombinieren

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

Indizes kombinieren

Beitragvon nils123 » Fr Mär 27, 2009 6:26 pm

Hi!
Ich bin YaCy-Anfänger (der erste Crawl läuft gerade) und habe ein paar Fragen:
- Wie kann ich mehrere getrennte Indizes anlegen und je nach Bedarf bei der Suche einzeln auswählen und ggf. kombinieren - das kann zur Not auch auf unterschiedlichen PCs/Virtual Machines sein.
- Wie kann ich die zu indizierenden Seiten auf jene Einschränken, die IM TEXT ein bestimmtes Wort enthalten (ich habe gesehen wie das in der URL geht, aber das reicht nicht). Idealerweise soll der Crawler auch nur Links folgen, die auf so einer Seite sind.
- Gibt es ein aktuelles Einführungsbuch (Sprache DE, EN oder ES) oder entsprechendes aufbereitetes Online-Material (das WIKI kenne ich)?

Vielen Dank für Eure Antworten!

Nils
nils123
 

Re: Indizes kombinieren

Beitragvon Lilirasa » Sa Mär 28, 2009 4:20 pm

Salut Nils,
Willkommen im Forum. :)

nils123 hat geschrieben:- Wie kann ich mehrere getrennte Indizes anlegen und je nach Bedarf bei der Suche einzeln auswählen und ggf. kombinieren - das kann zur Not auch auf unterschiedlichen PCs/Virtual Machines sein.

Wenn Du über entsprechend RAM verfügst kannst du mehrere YACY Instanzen laufen lassen. Für jede neue Instanz einfach neuen Ordner anlegen und die Programmdateien darin entpacken. Natürlich muss jeder YACY Instanz ein eigener Port zugewiesen werden.
Zum Kombinieren kommt es darauf an was Du machen willst? Evtl. wäre die Option "öffentlicher Cluster" unter http://localhost:8080/ConfigNetwork_p.html etwas für dich. Ansonsten müsstest du mit der Yacy-API und ein bisschen PHP oder einer anderen Skriptsprache selbst Hand anlegen.

- Wie kann ich die zu indizierenden Seiten auf jene Einschränken, die IM TEXT ein bestimmtes Wort enthalten (ich habe gesehen wie das in der URL geht, aber das reicht nicht). Idealerweise soll der Crawler auch nur Links folgen, die auf so einer Seite sind.

Das ist z.Z. leider nicht möglich.

- Gibt es ein aktuelles Einführungsbuch (Sprache DE, EN oder ES) oder entsprechendes aufbereitetes Online-Material (das WIKI kenne ich)?

Wir haben zur Zeit nur das Wiki. YACY ist momentan noch in Entwicklung und viele Dinge ändern oder kommen neu hinzu, so das weitergehende Dokumentation schnell veraltet wäre. YACY soll aber bald v1.0 erreichen, so das man dann vielleicht mehr Zeit zur Dokumentierung aufbringen kann.

Grüsse
Andi
Lilirasa
 
Beiträge: 71
Registriert: So Sep 14, 2008 11:28 am

Re: Indizes kombinieren (Robinson Mode)

Beitragvon Quix0r » Fr Apr 24, 2009 12:13 pm

Ich bekomme bald meinen Hauptrechner einsatzbereit und habe zum Public Cluster eine passende Frage:

Die Daten (DATA-Verzeichnis) auf meinen derzeitigen Rechner (Router) will ich rüberkopieren auf den Hauptrechner und den Router als eigene Node betreiben. Da der Router - bekanntermaßen - direkt am Internet hängt, sich aber Clients im Netz nicht auch noch durch die enge DSL-Verbindung (Upstream ist gemeint) sich durchquetschen sollen, will ich diese so konfigurieren, dass sie sich nur an den Router anbinden und diesen supportieren.

Wie müsste ich nun den Router und die am Router hängenden Clients seitens YaCy konfigurieren, dass dies auch klappt? Die Clients sollen praktisch als "Slaves" fungieren, der Router als Suchportal und "Frontend-Node" und dabei die Crawls auf die Clients verteilen.
Quix0r
 
Beiträge: 1345
Registriert: Di Jul 31, 2007 9:22 am
Wohnort: Krefeld

Re: Indizes kombinieren

Beitragvon Quix0r » Mo Jan 25, 2010 10:28 am

Zu meinem voherigen Post und die versuche Erklaerung am Liebl-Lab an Orbiter: Service Locator Pattern. :) Den reinen Crawler und den reinen Indexer soweit aus YaCy raustrennen, dass diese auf entfernten Rechner als Services laufen koennen und die eigentliche YaCy-Node mit diesen kommuniziert, als wuerde sie die lokal aufrufen.

Dazu ergaenzend diser Link: http://www.mxchange.org/yacy-modi.html und dieser Beitrag: viewtopic.php?f=9&t=2226&hilit=
Quix0r
 
Beiträge: 1345
Registriert: Di Jul 31, 2007 9:22 am
Wohnort: Krefeld


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 4 Gäste