eine Woche Yacy: Resume und Knackpunkte für den Erfolg

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

eine Woche Yacy: Resume und Knackpunkte für den Erfolg

Beitragvon kaisef » Do Mai 17, 2012 9:28 am

Hallo zusammen,

Vorweg: ich weiß das ist alles viel Arbeit und nicht so einfach, dient auch nur als Anregung und schildert meine bescheidene Meinung.

Ich wollte kurz aus meiner Sicht die Knackpunkte nach einer Woche intensiv mit Yacy beschäftigen zusammenfassen, die Yacy zur Zeit noch den "großen" Erfolg vermasseln
* da ich Diplom Informatiker bin, werden die Punkte bei weniger IT-affinen Menschen natürlich exponentiell stärker zu Tage treten und mehr abschrecken
* mich schreckt es natürlich nicht ab, ich werde versuchen, mindestens im Bereich testen/Werbung für die Verbreitung machen mitzuarbeiten ;)

also
* das System ist noch extrem unstabil. Bisher kann niemand außer Idealisten im Markt überzeugt werden, Yacy zu benutzen. Geht man auf die "Demo" Seiten im Netz, ohne selbst zu installieren, bekommt man regelmäßig (gefühlt jedes 3. Mal) irgendwie gar keine Ergebnisse oder endlos langsam, und man versteht nicht, welche Ergebnisse nun von welchem Peer kommen. Viele werden vor dem selbst installieren kurz auf so eine Demo Seite gehen, die erste Hürde. Genau so oft gibt es übrigens Probleme beim Suchen mit dem eigenen Webserver/Peer. Man kann es einfach nicht kleinreden. Das wichtigste überhaupt ist der Faktor: "funktioniert einfach", der oft von Open Source Usern und Linux Fans einfach nicht gesehen werden will.
* bei mir selbst läuft Yacy auf Windows, JVM bekommt 1.6 MB Speicher, läuft seit einer Woche und stürzt ungefähr alle 2-3 Tage komplett ab, Webserver ist nicht mehr ansprechbar, Peer wird bei anderen Peers als tot angezeigt, Java Version ist 1.6.0_32, falls der die JVM verwendet, die standardmäßig im Suchpfad liegt wenn ich ein cmd aufmache. Welche Java Versionen sind denn möglich bzw. empfohlen? Gibt es schon eine Übersichtstabelle mit Kompatibilitätsproblemen von diversen Java Versionen? Zeigt Yacy an wenn es die Java Version nicht mag? Kann man wenn mann mehrere JVMs hat die benutzte irgendwo konfigurieren? (also außer selbst cmd. Dateien oder Code zu ändern)
* Crawls die ich durchgeführt habe liegen jetzt seit 5 Tagen zur Verteilung bereit aber es kommt mir nicht so vor, als hätten sich meine gecrawlten Informationen verteilt. Also ist zu fragen, ob das P2P Netz von der Laufzeit der verteilten Verteilungsalgorithmen/Suchalgorithmen ausreichend auf ein schnelles Wachstum vorbereitet ist.
* der Knackpunkt für den Erfolg wird sein, dass "ganz normale" Benutzer mit dem Tool umgehen können. Zur Zeit wird man selbst als Informatiker von den Optionen gerade zu erschlagen. Das Tool muss viel selbststeuernder werden, und diese Selbststeuerung muss irgendwann idiotensicher vorkonfiguriert sein. Stichwort: gut funktionierendes Ressourcenmanagement, Balance zwischen Crawlen, Indizieren, verteilen ohne die Performance der eigenen Suche runterzubremsen. Man darf nichts verstehen müssen und das Tool trotzdem nutzen inkl. kleinem Crawl Anteil. Die zahlreichen Optionen und Bilder die ich jetzt faszinierend finde, wird die meisten abschrecken. Eigentlich braucht man NUR das Suchfenster für den 0815 Nutzer, alle zahlreichen Optionen sollten eher dezent im Hintergrund aufzurufen sein, und man sollte keine Angst haben, dass Yacy was weiß ich was tut wenn man nicht alle Konfiguration verstanden hat.
* Zentral ist der Nutzertypen Kreis, und wen wir erreichen, die beiden Zentralen Dimensionen sind dabei IT-Affinität/Informatik Know-How und Idealismus für dezentrale Suche. Beide Dimensionen möchte ich in Skala 0-10 angeben, wobei 0 gar nicht IT-affin / idealistisch bezüglich dezentraler Suche ist und 10 völlig it-affin+idealistisch.
Ich glaube Yacy erreicht zur Zeit nur Personen mit (IT-Knowhow >= 8/10 und Idealismus >= 8/10). Wie man sich vorstellen kann weisen die beiden Dimensionen eine bestimmte Verteilung über alle Menschen auf und die Gruppe der Erreichten steigt mehr als linear, wenn man die Zahlen runterbekommt (Verteilung der Attribute!) , das ist denke ich der Hauptfaktor für den Erfolg. Die Idealismuszahl wird man wahrscheinlich nicht tiefer als 5 runterkriegen, denn wieso soll ich mir irgendwas installieren wenn "Google doch perfekt funktioniert". Die ITKnowhow Zahl müssen wir aber unbedingt runter kriegen, da Leute mit mittel-hohem Idealismus und wenig IT-Knowhow zur Zeit keine Chance haben zu Yacy beizutragen.
Und jetzt 3 Tage in den Schwarzwald und weg vom Rechner ;)

Viele Grüße,
Kaisef
kaisef
 
Beiträge: 9
Registriert: Do Mai 10, 2012 6:51 pm

Re: eine Woche Yacy: Resume und Knackpunkte für den Erfolg

Beitragvon LA_FORGE » Sa Mai 26, 2012 10:54 pm

Vielen Dank für deine forensischen Analysen. Zu meiner Person: Ich habe kein Informatikstudium absolviert, beschäftige mich aber seit 1992 intensiv mit der Materie. Mein Schwerpunkt liegt mittlerweile im Linux- und Unix-Umfeld (ich baue mir meine Kernel selbst und lege großen Wert auf hochverfügbare Systeme). Beruflich bin ich als IT-Ingenieur tätig und arbeite im Umfeld mit komplexen Daten(bank)strukturen.

Es ist keine Seltenheit, dass einer meiner YaCy-Peers mehrere Wochen ohne Unterbrechung läuft und schon mal an die 400 GB an Crawler-Traffic generiert. Die exponentiell steigenden Nutzerzahlen (aktiv und passiv) sprechen für sich. Ich habe innerhalb eines Zeitraums von 2 Wochen den Traffic im Freeworld-Netz gemessen und analysiert und bin zu der Erkennis gekommen, dass wir weitaus mehr Peers im 'freeworld' haben, als auf yacystats.de gelistet sind. Zusätzlich zu den Heimanwendern zählen etliche Universitäten und wissenschaftliche Institutionen zum Nutzerkreis. Bei über 80% der Peers ist es oft keine Seltenheit, dass sie 24/7 am Netz sind (dies entnehme ich den repetitiven Zugriffen aus global über 440 IP-Ranges mit unterschiedlicher Größe). Bitte überdenke deine Knackpunkte zum Erfolg noch einmal.
LA_FORGE
 
Beiträge: 559
Registriert: Sa Okt 11, 2008 5:24 pm


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste