Yacy: Energieverbrauch und CO2-Ausstoss

Allgemeines und Nachrichten zu Suchmaschinen-Themen

Yacy: Energieverbrauch und CO2-Ausstoss

Beitragvon David » So Feb 09, 2014 9:12 pm

Mich würde mal interessieren, wie es mit dem Energieverbrauch und dem CO2-Ausstoss eines dezentralen Suchmaschinennetzwerks wie Yacy aussieht, im Vergleich zu einer zentralen Suchmaschinen wie Google.

Meine Befürchtung ist, dass Yacy verhältnismässig um einiges weniger umweltfreundlich arbeitet. Schon alleine, weil die Indexierung, im Gegensatz zu einer zentralen Suchmaschine, nicht koordiniert wird und jeder Netzwerkteilnehmer sein eigenes Süppchen kocht und sich nicht darum kümmert was die Anderen machen. Was theoretisch dazu führen kann, dass hunderte Peers gleichzeitig die gleiche Seite indexieren.

Eher wenig energieeffizient ist glaube ich auch, dass Indexdaten von anderen Netzwerkteilnehmer generell nicht vertraut werden kann, und daher jede Seite zuerst einmal heruntergeladen und der Inhalt verifiziert werden muss, bevor sie in die Suchergebnisse aufgenommen werden kann.
David
 
Beiträge: 170
Registriert: Di Mär 05, 2013 5:35 pm

Re: Yacy: Energieverbrauch und CO2-Ausstoss

Beitragvon Lotus » Mi Feb 12, 2014 7:58 pm

Ich denke, das kommt ganz darauf an, wie man rechnet.
Wenn man den Grundgedanken nimmt, dass YaCy auf den Rechnern der Nutzer läuft, dann ist dort kein oder nur wenig zusätzlicher Stromverbrauch, weil der Rechner ohnehin läuft.
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: Yacy: Energieverbrauch und CO2-Ausstoss

Beitragvon flegno » So Aug 17, 2014 8:11 pm

David hat geschrieben:Meine Befürchtung ist, dass Yacy verhältnismässig um einiges weniger umweltfreundlich arbeitet. Schon alleine, weil die Indexierung, im Gegensatz zu einer zentralen Suchmaschine, nicht koordiniert wird und jeder Netzwerkteilnehmer sein eigenes Süppchen kocht und sich nicht darum kümmert was die Anderen machen. Was theoretisch dazu führen kann, dass hunderte Peers gleichzeitig die gleiche Seite indexieren.
Ich kann mir eine Lösung vorstellen, wo YaCy - ähnlich - wie es momentan vermutlich Google macht - während jeder Indexierung prüft, ob das Dokument bereits indexiert wurde und Duplikate ausschließt - wäre sinnvoll m.E. auch wegen den Speicherplatz verbrauch. Das würde u.a. auch sich auf die Indexgröße in der gesamten YaCy-Infrastruktur bspw. für ein 100 Seiten langes PDF-Dokument, dass 100 mal auf unterschiedlichen Servern rumliegt, spürbar auswirken.

David hat geschrieben:Eher wenig energieeffizient ist glaube ich auch, dass Indexdaten von anderen Netzwerkteilnehmer generell nicht vertraut werden kann, und daher jede Seite zuerst einmal heruntergeladen und der Inhalt verifiziert werden muss, bevor sie in die Suchergebnisse aufgenommen werden kann.
vlt. verstehe ich dein Anliegen an dieser Stelle nicht, aber warum kann ich einem Index mehr oder weniger vertrauen, wenn ich eine Webseite heruntergeladen habe? Kannst du mir erklären, was du unter Verifizierung verstehst?

Gruss, flegno
Zuletzt geändert von flegno am Mo Aug 18, 2014 7:45 am, insgesamt 1-mal geändert.
flegno
 
Beiträge: 232
Registriert: So Aug 17, 2014 4:23 pm

Re: Yacy: Energieverbrauch und CO2-Ausstoss

Beitragvon Orbiter » Mo Aug 18, 2014 12:04 am

David hat geschrieben:weil die Indexierung, im Gegensatz zu einer zentralen Suchmaschine, nicht koordiniert wird und jeder Netzwerkteilnehmer sein eigenes Süppchen kocht und sich nicht darum kümmert was die Anderen machen. Was theoretisch dazu führen kann, dass hunderte Peers gleichzeitig die gleiche Seite indexieren.

Das kann man aus zwei Seiten betrachten:
- im nicht-koordinierten p2p Netz würde eine Koordinationsmethodik eine Möglichkeit zum Missbrauch als Zensurmittel bedeuten. Wenn ein Peer eine Indexierung verhindern will, muss er nur behaupten dass der Crawl bereits durchgeführt wurde und die anderen Peers würden gehorchen. Dieser Zensurhack kann man m.E. nach nur verhindern, indem man so einen Check einfach nicht macht.
- Man kann aber einen Crawl verteilen und andere Peers zum Laden von Seiten auffordern. Wenn man so etwas innerhalb eines eigenen Netzes macht (es ist ja nicht nur das default 'freeworld' Netz möglich sondern auch eigene) und diese Vorgehensweise zum Konzept erklärt ('nur einer crawlt, alle anderen helfen') dann ist das aber ein koordiniertes Netz aufgrund der Organisation der Teilnehmer untereinander.

Also ist beides möglich: nicht koordiniert und auch nicht zensierbar und koordiniert, ebenfalls nicht zensierbar und auch mit verteilten Doublettencheck.
Orbiter
 
Beiträge: 5792
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Yacy: Energieverbrauch, Redundanz, YaCy-Resistenz gegen Zens

Beitragvon flegno » Mo Aug 18, 2014 3:58 am

Orbiter hat geschrieben:Also ist beides möglich: nicht koordiniert und auch nicht zensierbar und koordiniert, ebenfalls nicht zensierbar und auch mit verteilten Doublettencheck.

Habe YaCy entdeckt und bin dabei, deren spannende Möglichkeiten kennenzulernen und andere Mitmenschen für YaCy zu gewinnen :). Anregung - ich könnte viele YaCy-Features, YaCy-Möglichkeiten wesentlich schneller begreifen, anwenden und andere Leute dafür gewinnen, wenn für die Ausführungen wie die vom Orbiter oben ggf. auch Verweise auf entsprechende Quellen mit gepostet würden - damit man eine Chance hat, nachzuschlagen, was damit gemeint ist.

Bei diesen speziellen Thema wie im Zitat oben würde ich am besten begreifen, wenn ich eine Möglichkeit habe, entsprechende YaCy-Installationen in diesen oben erwähnten Szenarien
  • nicht koordiniert und auch nicht zensierbar und koordiniert,
  • ebenfalls nicht zensierbar und auch mit verteilten Doublettencheck.
anzusehen und zu testen. Geht das?

Habe testweise für die Besucher meiner Website YaCy-Box eingebaut - s. auf der Website thesearch.sprechrun.de unten.
flegno
 
Beiträge: 232
Registriert: So Aug 17, 2014 4:23 pm


Zurück zu Suchmaschinen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste

cron