Mehrere Indizes auf einem Rechner möglich?

Keine Scheu, hier darf alles gefragt und diskutiert werden. Das ist das Forum für YaCy-Anfänger. Hier kann man 'wo muss man klicken' fragen und sich über Grundlagen zur Suchmaschinentechnik unterhalten.
Forumsregeln
Hier werden Fragen beantwortet und wir versuchen die Probleme von YaCy-Newbies zu klären. Bitte beantwortete Fragen im YaCy-Wiki http://wiki.yacy.de dokumentieren!

Mehrere Indizes auf einem Rechner möglich?

Beitragvon hotel24 » Mi Apr 17, 2013 4:54 pm

Ich möchte unterschiedliche Indizes auf einem Rechner erstellen. Ist es dazu notwendig, einen zweiten Peer einzurichten (also eine zweite YaCy-Installation) oder lässt sich dies im Rahmen einer YaCy-Installation einrichten. Also dass man zb dem Crawler sagt, befülle collection1, collection2, etc. und bei der solr-Abfrage ebenfalls, verwende core=collection1, oder core=collection2, etc.

LG, hotel24
hotel24
 
Beiträge: 52
Registriert: Di Jan 22, 2013 1:17 pm

Re: Mehrere Indizes auf einem Rechner möglich?

Beitragvon hotel24 » Mi Apr 24, 2013 12:59 pm

ich habe die Situation nun mit einer anderen Vorgehensweise gelöst.

Kurz zur Info: Ich möchte die Seiten im Index bestmöglich aktuell halten. Aus Ressourcen-/Zeitgründen möchte ich daher die 200er-Seiten öfter abgleichen als jene mit Fehlercode. Da der Crawler aber nicht auf 200er Seiten beschränkbar ist, wollte ich nun alle 200er exportieren und anschließend in einem separaten Index ablegen und regelmäßig crawlen. Der primäre Gesamtindex hingegen sollte nur mehr in größeren Zeitabständen gecrawlt werden.

Jetzt bin ich auf die Idee gekommen, anstelle des separaten Index einfach einen weiteren Crawlingprozess mit den exportierten 200er Seiten im Rahmen des Gesamtindex zu starten. Dadurch kann ich den Crawler nun doch auf 200er Seiten einschränken und mein Vorhaben lässt sich umsetzen.
hotel24
 
Beiträge: 52
Registriert: Di Jan 22, 2013 1:17 pm

Re: Mehrere Indizes auf einem Rechner möglich?

Beitragvon Orbiter » Mi Apr 24, 2013 2:18 pm

oh, nicht schlecht, aber auch zu schnell, denn ich hab auch was gebaut! Man kann jetzt die collections aus dem crawl Start als Option bei der Suche angeben, und damit einen Teilidex ansprechen. Ist fertig aber noch nicht im git... Der Punkt ist: so wie das Interface ist, ists noch nicht praktikabel. Man muss quasi was am Suchinterface machen oder ein anderes draufsetzen, und dafür ist das yaml4-Webinterface der richtige Kandidat.

Ich will das in den nächsten Tagen auch umsetzen, indem ich auf einem YaCy zwei getrennte Suchportale betreibe, und zwar die geocaching-Seiten und einen Freifunk-Index, den ich noch machen will. Bitte ein wenig Geduld, bin noch am basteln...
Orbiter
 
Beiträge: 5792
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main


Zurück zu Hilfe für Einsteiger und Anwender

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast