[Allgemein] Die Technologie

Ereignisse, Vorschläge und Aktionen

[Allgemein] Die Technologie

Beitragvon Matthias.Ronge » Fr Jun 20, 2008 8:34 am

Ich habe ein paar Fragen, die mir die Website (die ich gefunden hatte) nicht eindeutig beantwortet hat:

Welche Schnittstellen bietet das YaCy-System?

Können Andere meinen Index herunterladen/integrieren? Kann ich den Index von Anderen herunterladen/integrieren?

wenn ja: Besteht die Möglichkeit nur die Änderungen (Delta) zwischen einem vorigen Zustand und dem aktuellen Zustand herunterzuladen? (Hinzugefügte Einträge, gelöschte Einträge, ...?)

wenn ja: Besteht die Möglichkeit, nur einen Teil des Index (z.B. mit einer gezielten Anfrage) herunterzuladen?

und/oder Leitet das Netz Suchanfragen an mich weiter, die von meinem Rechner beantwortet werden (müssen), damit das System Sinn macht?

und/oder kann ich "nur" meine indexierten Informationen zur Verfügung stellen, oder muss ich eine Web-Schnittstelle zum Suchen anbieten, damit das System Sinn macht?

und dann zum Schluss noch:
Welche Systemressourcen würde ein Anbieter brauchen, wenn er einen Index mit -sagen wir mal- 10,2 Mio. Einträgen und regelmäßigem Zuwachs von ca. 1000 Einträgen pro Tag im Yacy-Netz zur Verfügung stellen wollen würde? Eine grobe Abschätzung reich natürlich (Anzahl Server/CPUs, besser mehrere CPUs auf einem Rechner oder mehrere Server?, ungefährer Speicherbedarf, ungefährer Traffic mit dem Yacy-Netz?) Bzw. gibt es da eine Faustformel?

Liebe Grüße,
Matthias
Matthias.Ronge
 
Beiträge: 1
Registriert: Fr Jun 20, 2008 8:15 am

Re: [Allgemein] Die Technologie

Beitragvon Lotus » Fr Jun 20, 2008 3:05 pm

Als Schnittstelle zum Index gibt es URL-Export Funktionen und die Suchmaske.
Was Sinn macht hängt vom Anwendungsfall ab. Im Freeworld-Netz bekommst du alle Suchanfragen zugeteilt, die du anhand deiner Position im (DHT)Netz beantworten kannst. Die Suchfunktion kannst du über die Suchseite für die Öffentlichkeit sperren.

1000 neue Seiten pro Tag sind "nichts". Das sind gerade einmal 365000 Seiten im Jahr. Für die angesprochene Größe würde ein normaler 2GHZ-Rechner mit 1 GB RAM ausreichen. Für superschnelle Suchergebnisse wäre ein Cluster über 2 Rechner / 2 Festplatten empfehlenswert. Mit der angegebenen Größe reicht aber auch locker ein Rechner für schnelle Ergebnisse.
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg


Zurück zu Mitmachen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron