YACY im I2P Netzwerk

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

YACY im I2P Netzwerk

Beitragvon zack » Mo Feb 14, 2011 11:26 am

Hallo.
Ich hab gestern mal spontan einen yacy-node im I2P Netwerk aufgesetzt ( http://i2p2.de. ) Im Moment läuft er im Robinson Modus. Ist also ganz allein, der arme. Ich hab jetzt zufällig auch gesehen, dass das schon ein paar Leute vor mir versucht haben: http://www.yacy-websuche.de/wiki/index.php/De:YaCy-i2p (das war 2006).

Meine Konfiguration sieht im Moment so aus:
    Yacy anweisen als Proxy ein HTTP-Tunnel ins I2P Netz zu verwenden.
    Einen Blacklist-Eintrag anlegen:
    Code: Alles auswählen
    ((.+\.)(?!i2p).+)/.*
    Loscrawlen
    I2P-HTTP-Servertunnel aufmachen und auf YACY-Port zeigen lassen (um eine Websuche betreiben zu können)

Ich will also mit meiner YACY-Suche sämtliche Eepsites, also alle Adressen mit der TLD '.i2p' indizieren.

Das ganze kann man auch schon auf http://zack.i2p/ bzw. auf http://gfs3qo7s5lwho57ale2xlnz44pu6mykj ... q.b32.i2p/ bewundern.

Mir sind jetzt aber einige Schwächen und Mängel oder fehlende Funktionen aufgefallen die YaCy hat bzw die mir nicht bekannt sind:
    Kein Whitelisting: Meine Regex muss sich mit negative lookaround behelfen, und stimmt auch nicht 100%ig. (bei mir ist sind z.b. alle Subdomains geblacklistet, obwohl ich das eigentlich gar nicht will)
    Oft passieren I/O Timeouts beim Crawlen (manchmal, wenn mit dem I2P-Tunnel irgendwas nicht stimmt, oder das Netz gerade langsam ist). Was passiert mit solchen Domains, werden die verworfen, oder nach einiger Zeit erneut gecrawled? Kann man das irgendwo einstellen?
    DIe Suche nach einem Begriff, der eigentlich sicher Ergebnisse hervorbringen müsste, liefert manchmal keine Ergebnisse. Erst nachdem ich die suche einfach ein 2. mal starte, kommen Ergebnisse.
    Mir ist aufgefallen, dass er Domains, wie zzz.i2p als local ansieht. (ich hab die webportal-netzdefinition verwendet). erst nachdem ich das in der netzdefinition manuell auf any gesetzt hab, hat er auch diese Domain gecrawlt. Warum also ist zzz.i2p 'local' und forum.i2p 'global'? Stimmt da irgendwas in irgendeinem Filter nicht?
Achja im Moment läuft hier Yacy 0.99/7478

Ich glaub, dass ein "anonymes Suchnetzwerk" nicht so einfach zu Realisieren ist, da Yacy mit IPs und Ports arbeitet, man müsste, denk ich, vieles anpassen. Man könnte höchstens ein Netzwerk schaffen, wo die Peers gegenseitig übers normale Internet kommunizieren, aber das widerstrebt den meisten I2P-Nutzern :-)
zack
 
Beiträge: 1
Registriert: Mo Feb 14, 2011 10:36 am

Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste