Datenschutz-Problem?

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

Datenschutz-Problem?

Beitragvon ChrisJ » So Jul 27, 2008 5:44 pm

Hallo Community,

ich würde gerne Yacy in meinem Netzwerk einsetzen um diese Peer2Peer Suchmaschine zu unterstützen. Allerdings habe ich keine schnell Bandbreite, doch bin gerne bereit sie Zeitweise zur Verfügung zu stellen. Jetzt habe ich aber unterschiedliche Fragen die die Datenschutz betreffen.

1. Ich möchte nicht das yacy als Proxy für mine Netzwerk arbeitet.
2. Ich möchte keinen Blog und kein Wiki. Einfach nur ein Suchportal und einen Crawler der nicht permanent das Internet durchforstet sondern immer nur dann wenn ich entsprechende Ressourcen freigebe. Die gefundenen Suchergebnisse werden dann selbstverständlich geteilt.
3. Ich möchte nicht das Seiten aus meinem Intranet gespeichert oder Indexiert werden.
4. Da Privoxy und Tor schon verwendet werden möchte ich diese Funktion auch nicht nutzen.
5. Ich will auch kein File-Shaering-Space usw.

Eigentlich bin ich von der Idee dieser Suchmaschine begeistert, doch einige Punkte stören mich noch:
1. Die Ergebnisse sind noch nicht so gut wie erwartet.
2. Ich habe die Befürchtung das wesentlich detailliertere Benutzerprofile unter Yacy entstehen wenn sie vor allem auf dem eigenen Rechner gespeichert werden.
3. Mir scheinen zu viele Programme per Standardeinstellung zu laufen, was ein erhöhtes Sicherheitsrisiko darstellt.
4. Die Suchinhalte können ebenfalls Manipuliert werden wenn entsprechend viele Peers eine Seite indexieren oder nicht?

Kurz: Was ich will ist eine p2p Suchdienst der nur zu Bestimmten Zeiten das Internet von alleine Durchforstet.. aber automatisch die Seiten die ich besuche Indexiert. Denn dadurch lässt sich bestimmt (m)ein Userprofiel aus den Yacy-Suchergebnissen "erstellen".

Ist Yacy etwas für mich?
ChrisJ
 
Beiträge: 8
Registriert: So Jul 27, 2008 5:19 pm

Re: Datenschutz-Problem?

Beitragvon Lotus » So Jul 27, 2008 6:40 pm

Hallo Chris!

Zu 1.1-1.4 ohne 1.3:
Wenn du es nicht nutzt, fallen in dieser Hinsicht auch keine Daten an. File Sharing als P2P-Modus macht YaCy nicht. YaCy hat nur einen öffentlichen Ordner in den du Dateien kopieren kannst.

Zu 1.3:
Intranet-Seiten werden in der Eingangskonfiguration nicht indiziert. Dafür muss erst auf Webportal oder Intranet-Modus umgeschaltet werden.

ChrisJ hat geschrieben:1. Die Ergebnisse sind noch nicht so gut wie erwartet.

Die Regel lautet grob: mehr Teilnehmer = bessere Ergebnisse. Falls du Interesse bekommst, kannst du sogar das Ranking anpassen. Mir gefällt z.B. eine höhere Gewichtung der Wörter in der URL und Titel besser.

ChrisJ hat geschrieben:2. Ich habe die Befürchtung das wesentlich detailliertere Benutzerprofile unter Yacy entstehen wenn sie vor allem auf dem eigenen Rechner gespeichert werden.

YaCy speichert keine Nutzerprofile. Falls du den Proxy-Modus nutzt kannst du die Logs von diesem deaktivieren. Zur Sicherheit ist die Protokollierung standard ein.
Falls Profile von Dritten erhoben werden kannst du das Profil mit YaCy eher "verschlampen".

ChrisJ hat geschrieben:3. Mir scheinen zu viele Programme per Standardeinstellung zu laufen, was ein erhöhtes Sicherheitsrisiko darstellt.

Damit kommt YaCy gut zurecht. Die Architektur und Standard-Einstellungen von YaCy sind besonders sorgfältig ausgelegt, um die Privatsphäre zu erhalten. Da YaCy keinen externen Programmcode ausführt sollten Bedenken ausgeschlossen werden.

ChrisJ hat geschrieben:4. Die Suchinhalte können ebenfalls Manipuliert werden wenn entsprechend viele Peers eine Seite indexieren oder nicht?

Die Suchergebnisse werden vor der Anzeige ausgewertet. Du bekommst nur Seiten zu sehen auf die deine Anfrage auch tatsächlich zutrifft.

ChrisJ hat geschrieben:Kurz: Was ich will ist eine p2p Suchdienst der nur zu Bestimmten Zeiten das Internet von alleine Durchforstet.. aber automatisch die Seiten die ich besuche Indexiert. Denn dadurch lässt sich bestimmt (m)ein Userprofiel aus den Yacy-Suchergebnissen "erstellen".

Das widerspricht sich etwas mit deinen Anforderungen. Bitte noch einmal konkreter erläutern.
Momentan (!) können Crawls nicht zu bestimmten Zeiten geplant werden. In der Hinsicht ist gerade etwas in der Entwicklung. Du kannst diese Funktion momentan manuell pausieren.
Um YaCy zu unterstützen muss nicht gecrawlt werden. Ein laufender Peer hilft schon enorm bei der Verteilung des Indexes.

ChrisJ hat geschrieben:Ist Yacy etwas für mich?

Sicher! :) Bei weiteren Fragen stehen wir dir im Forum bereit.
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: Datenschutz-Problem?

Beitragvon DanielR » Mo Jul 28, 2008 1:13 pm

ChrisJ hat geschrieben:1. Ich möchte nicht das yacy als Proxy für mine Netzwerk arbeitet.

Es lässt sich genau festlegen wer den Proxy nutzen darf. Per default darf das lokale Netzwerk dies. Ist unter Admin Console -> Advanced Settings -> Proxy Access Settings änderbar.

ChrisJ hat geschrieben:2. Ich möchte keinen Blog und kein Wiki.

Wie bereits gesagt, muss man das nicht nutzen. Ist dann nur eine leere Seite (darf nicht von jedem bearbeitet werden, erst nach Konfiguration).

ChrisJ hat geschrieben:Einfach nur ein Suchportal und einen Crawler der nicht permanent das Internet durchforstet sondern immer nur dann wenn ich entsprechende Ressourcen freigebe.

Zurzeit kannst du den Crawler bequem mit einem Klick pausieren und wieder weiter laufen lassen. Zeitpläne sind wie bereits erwähnt (z.Z.) nicht möglich.

ChrisJ hat geschrieben:3. Ich möchte nicht das Seiten aus meinem Intranet gespeichert oder Indexiert werden.

Alle lokalen Adressen werden im normalen Betrieb (freeworld) ignoriert (also die privaten IP-Netze 192.168., 10., 169.254., 172.16-31., 127.).

ChrisJ hat geschrieben:4. Da Privoxy und Tor schon verwendet werden möchte ich diese Funktion auch nicht nutzen.

Das ist keine spezielle Funktion von YaCy, sondern ein Spezialfall von Domains bzw. Proxy-Einstellungen.

ChrisJ hat geschrieben:5. Ich will auch kein File-Shaering-Space usw.

Tja, den Space hast du. Musst ihn nicht nutzen. Da YaCy eine Weboberfläche besitzt, ist es einfach da eigenen Dateien rein zu kopieren. Aber wie bereits gesagt: kein P2P, sondern einfach nur Webspace. Zusätzliche Dateien zu den Standardseiten (Suchformular, Konfigurationsseiten) die du als Administrator selber einspielen müsstest.

ChrisJ hat geschrieben:2. Ich habe die Befürchtung das wesentlich detailliertere Benutzerprofile unter Yacy entstehen wenn sie vor allem auf dem eigenen Rechner gespeichert werden.

Auf dem eigenen Rechner hast du aber die Kontrolle! Du kannst z.B. die Logs deaktivieren bzw. weißt im allgemeinen wer Zugriff auf den Rechner hat.
Und wie bereits gesagt: Es werden keine konkreten Profile erstellt!

ChrisJ hat geschrieben:3. Mir scheinen zu viele Programme per Standardeinstellung zu laufen, was ein erhöhtes Sicherheitsrisiko darstellt.

Es läuft nur ein Programm: YaCy! Aber alle Funktionen sind möglich, das stimmt. Es gibt wenige Möglichkeiten einige Programmteile zu deaktivieren. Z.B. kann man die Zahl der CrawlThreads evtl. auf Null setzen. Damit würde der Code gar nicht laufen. Die meisten (sichtbaren ;)) Funktionen sind die über das Webinterface erreichbaren. Hier laufen aber die "Programme" nur beim Aufruf der Seite. Du kannst durch löschen der Seite dann die Funktion auch komplett abstellen :).

ChrisJ hat geschrieben:4. Die Suchinhalte können ebenfalls Manipuliert werden wenn entsprechend viele Peers eine Seite indexieren oder nicht?

Das verstehe ich nicht. Wenn viele die Seite indexieren ist es doch schwerer das zu manipulieren. Wenn dein Rechner der einzigste wäre, dann könntest du das Suchergebnis für alle verändern. So wäre das nur ein Teil von vielen.

ChrisJ hat geschrieben:Was ich will ist eine p2p Suchdienst der nur zu Bestimmten Zeiten das Internet von alleine Durchforstet

Er durchforstet alleine (mit entsprechender Startkonfiguration). Aber die "bestimmtem Zeiten" musst du selber machen (Start/Pause).

ChrisJ hat geschrieben:.. aber automatisch die Seiten die ich besuche Indexiert. Denn dadurch lässt sich bestimmt (m)ein Userprofiel aus den Yacy-Suchergebnissen "erstellen".

Die besuchten Seiten werden über den Proxy indeziert. Wenn du also beim surfen den YaCy-Proxy benutzt, werden alle angesurften Seiten indexiert. Wenn du der einzige Proxy-Benutzer bist (und das bekannt ist ;)), dann sind die Suchergebnisse deines Peers, sicherlich deinem Surfverhalten zuzuordnen. Aber das ist eine schwarz-weiß-Sicht. Das Grau ist nämlich, dass beim normalen Crawl ja neben einer Seite noch alle verlinkten Seiten besucht werden. Das verwischt das ganze etwas. Ausserdem sind die Ergebnisse ja nicht sortiert nach Surfreihenfolge. Wenn mehrere Leute einen Peer nutzen ist dieser Punkt sicherlich zu vernachlässigen.

ChrisJ hat geschrieben:Ist Yacy etwas für mich?

Klar :D
DanielR
 
Beiträge: 395
Registriert: Di Feb 12, 2008 2:22 pm

Re: Datenschutz-Problem?

Beitragvon Halborinda » Di Jul 29, 2008 6:09 am

Also ein bisschen muss ich ihm schon zustimmen...

In der Standard-Einstellung ist YaCy eine Benutzer-Profil-Krake: viewtopic.php?f=9&t=196

Ich finde es sehr schön, wenn jemand da sensibilisiert ist... Das ist nicht jeder...

In Zeiten der Voratsdatenspeicherumg macht es YaCy nicht viel besser:
* Jeder Zugriff erscheint in den Logs
* Jeder Proxy-Zugriff auch
* Jede Kommunikation zwischen den Server auch
* Cookies werden gespeichert
* (Statistische) Daten werden an YaCy-Stats übertragen, so dass man ein Benutzer-Profil erstellen kann, sofern YaCy nicht auf einen eigenen Server, sondern auf dem einzigen Rechner läuft, was wohl nicht selten der Fall ist

Warum YaCy neben seiner Hauptfunktion auch noch File-Sharing, Wiki und Blogging machen muss, habe ich nicht verstanden, aber das ist in meinen Augen auch nicht wild.

Ich würde mich über ein YaCy freuen, welches im Standard Datenschutz-freundlich ist.

Es reicht schon, dass die Internet-Provider 6 Monate+ genaue Profile erstellen (können) und vorhalten. Da finde ich es sehr betrüblich, dass YaCy den Heimnutzer auch zum Hilfs-Sheriff verdonnert. Vorallem für alle, die nicht so technisch drauf sind und einfach das nur laufen lassen möchten.

Daher meine Bitte:
* In der Standard-Einstellung so wenig Logs wie möglich oder anonymisiert. Ich möchte gar nicht speichern, dass IP 123.123.123.123 gerade mit mir geredet hat.
* Auch nicht, dass IP xyz auf Seite zyx Zugriff
* Und schon gar nicht, welche Cookies mitsamt Inhalt ausgetauscht wurden
* Auch würde ich mich über eine Einstellung an der Oberfläche freuen, so dass man die (statistische) Datenübermittelung an YaCy-Stats unterbinden kann oder besser ein Opt-In.

So gesehen, ist es mit dem Schutz der Privatsphäre nicht so weit her bei YaCy: http://www.yacy-websuche.de/wiki/index.php/De:Privacy
Leider :-(
Man muss schon Wissen, Zeit und Energie reinstecken, um einen kleinen Teil zu deaktiveren. Und man müsste Programmieren und Patchen um den restlichen Teil Datenschutz-freundlich zu gestalten.

Also bitte macht YaCy gleich im Default Datenschutz-freundlich

Grüße

P.S.: Da fällt mir ein, wenn man aktiv einen Crawl-Auftrag absendet, so sieht jeder, welche Startseite Du aufgegeben hat. Auch muss man die Sufttipps erst händisch deaktivieren, damit nicht jeder sieht, was man so crawled.
Zuletzt geändert von Halborinda am Di Jul 29, 2008 6:55 am, insgesamt 2-mal geändert.
Halborinda
 
Beiträge: 217
Registriert: Sa Jul 07, 2007 7:58 am

Re: Datenschutz-Problem?

Beitragvon Lotus » Di Jul 29, 2008 6:52 am

Um die Logs zu deaktivieren sollte eine DATA/LOG/yacy.logging mit folgendem Inhalt reichen:
Code: Alles auswählen
.level=OFF

Die restlichen Levels müssen dann noch angepasst oder gelöscht werden.
In dieser Datei lässt sich auch der Proxy Log deaktivieren. (# Properties for the proxy access logger)

Zu den Cookies / HTCACHE gibt es hier schon eine Diskussion: viewtopic.php?p=1048

An YaCy-Stats werden keine Informationen übertragen und es können auch keine Benutzer-Profile über Surfverhalten erstellt werden. Der Zuwachs an Links/Wörtern kann aus mehreren Quellen kommen für die selbst keine Aktion gestartet werden muss. Auf YaCystats ist lediglich ersichtlich was ohnehin schon auf der Peer-Liste in YaCy zu sehen ist.
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: Datenschutz-Problem?

Beitragvon DanielR » Di Jul 29, 2008 11:39 am

1. Halborinda hat schon recht. YaCy sollte in den Default-Settings weniger loggen und Internas sichtbar machen. Das könnte man doch mit der Einstellung yacy_debug nur für die Entwickler freischalten!?

2. Logging deaktivieren finde ich nicht gut, da dann auch keine Fehler gemeldet werden. Dann besser in yacy.logging alles auf "Warning" stellen. Finde ich einen guten Default-Wert. Oder die vielen LogInfo zu LogFine ändern, so dass nur noch "wichtige" Dinge als Info geloggt werden.
DanielR
 
Beiträge: 395
Registriert: Di Feb 12, 2008 2:22 pm

Re: Datenschutz-Problem?

Beitragvon Orbiter » Di Jul 29, 2008 12:28 pm

Durch ein Verringern des Loggings ergibt sich keine erhöhte Datensicherheit, denn es wird jedem möglich sein, ein logging wieder einzustellen, oder sogar einzubauen. Statt dessen ergibt ein Logging so wie wir es jetzt haben eine höhere Transparenz, ohne diese Transparenz hätten wir hier dann auch eine ganz andere Diskussion mit den Fragen: "was weiss denn das System über mich", "welche Daten werden versendet", "was wird wie lange gespeichert" und so weiter. Alles Fragen die nicht unbedingt zu einem hohen Vertrauen führen.

Statt dessen haben wir hier Antworten klar und deutliche für jeden User auf diese Sicherheitsfragen:
- Suchanfragen werden anonymisiert
- es wird ein log nur rotierend gespeichert, die Speicherdauer beträgt nur wenige Tage und die Informationen sind nur technischer Art
- natürlich sind alle IPs der Nutzer bekannt. Das ist die Vorraussetzung das ein P2P-System wie auch überhaupt alles im Internet läuft funktioniert.
- es ist für niemanden sichtbar was jemand sucht, wenn man diese Suche privat macht. Bitte mal mit Google vergleichen: die speichern das nicht nur permanent, sie speichern sogar auf welchen Link der Ergebnisliste man nach der Suche klickt.

Wir habe schon vor längerer Zeit dieses Thema immer wieder diskutiert und sind immer der Meinung gewesen, dass wir jede Art von Überwachung, die ein 'böser' Teilnehmer bei sich selbst einbauen könnte auch selber einbauen können, und dann durch entsprechende Datenmodulierung Vorkehrungen treffen, so dass niemend ein Nutzerprofil anlegen kann. Wenn man bei dieser Bestrebung Schwächen entdeckt, so muss man diese beheben. Meiner Meinung nach wäre es ganz falsch eine solche Schwäche durch Abschalten des loggings zu beheben und somit eine Vogel-Strauss Taktik zu fahren, die schlussendlich eine geringere Datensicherheit zur Folge hat.
Orbiter
 
Beiträge: 5792
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Datenschutz-Problem?

Beitragvon Lotus » Di Jul 29, 2008 12:42 pm

Wie ich es verstanden habe geht es nur darum das Logging abzuschalten (Daten die nicht anfallen). Das geht bereits.

Cookies im Proxy nicht zu speichern finde ich auch sinnvoll. Darüber werde ich noch nachdenken. (evtl. Diskussion bitte auf oben verlinktem Thread weiterführen)
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: Datenschutz-Problem?

Beitragvon Orbiter » Di Jul 29, 2008 12:46 pm

der Proxy verwendet die Cookies nie! Sie werden nur gespeichert damit der User man sehen kann was eigentlich alles an Cookies umhergeschickt wird. Sollte der Proxy allerdings nicht für sich selbst benutzt werden, sondern für mehrere Leute, so sollten hier Datenschutzmechanismen greifen. D.h. das muss zumindest abschaltbar sein.

Ansonsten wäre ein Abschalten des Cookie-Loggings gleichbedeutend mit einem Abschalten der Anzeige der Cookies im eigenen Browser, ohne das eine Verwendung der Cookies geblockt wird. Es wird sich aber wohl niemand selber blind machen wollen, oder?
Orbiter
 
Beiträge: 5792
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Datenschutz-Problem?

Beitragvon ChrisJ » Di Jul 29, 2008 4:18 pm

Herzlichen Dank für eure rege Beteiligung an diesem Threna.

Ich werde auf jeden Fall Yacy starten und es auch weiterempfehlen. Allerdings stoße ich gerade schon auf mein erstes kleines Problem. Ich habe lediglich SSH-Zugriff auf meinen "Yacy-PC" und ein "localhost:8080" ist da grade nicht drin. Welche Sichere Lösung fällt euch ein wie ich jetzt ans webinterface komme?

Mir schwebt eine SSH-Umleitung von meinem Rechner der Via SSH da eingeloggt ist zu dessen localhost:8080. Ideen?
ChrisJ
 
Beiträge: 8
Registriert: So Jul 27, 2008 5:19 pm

Re: Datenschutz-Problem?

Beitragvon ChrisJ » Di Jul 29, 2008 4:55 pm

DanielR hat geschrieben:Auf dem eigenen Rechner hast du aber die Kontrolle! Du kannst z.B. die Logs deaktivieren bzw. weißt im allgemeinen wer Zugriff auf den Rechner hat.
Und wie bereits gesagt: Es werden keine konkreten Profile erstellt!


Ich werde mich wohl länger mit der Materie auseinandersetzen müssen. Der "Peer2Peer"-Teil ist es was mir hier sorgen bereitet da ich als Anfänger noch nicht weiß welche Informationen im "verteilten Yacy-Hirn" gespeichert werden. Natürlich hat man auf seinem eigenen Rechner die Kontrolle (nur nicht unbedingt als 0815 Win-Nutzer, da haben ihn manchmal andere). Was mir "Sorgen" machte waren irgendwie die Data-Mining Möglichkeiten. Bei einer solchen Suchmaschine. Denn das (mögliche - wenn jemand Teile von yacy unbemerkt modifiziert) "Potential" der Überwachung ist hier evtl wesentlich größer als bei Google und Co.

Was mir nicht schmeckt ist halt der Blog und das Wiki und die File-Sharing-Möglichkeit. Wenn jemand einen Blog "irgendwo" schreibt erkennt man das nicht so schnell die Zusammenhänge (Man muss erst den Benutzernamen usw. "auflösen"). "Hier" hat kann man direkt an die IP des Nutzers, auf welchem Yacy läuft.. und kann an jede Menge andere pers. Informationen kommen ohne sich überhaupt "im LAN" oder Zugang auf einem dieser Rechner zu haben. Wenn man sich ansieht welche Informationen die "Familie" da hinterlegt. Und wer dann noch seine Fotos, Filme, Musik und Co dort veröffentlicht... Ich finde das verführt einfach zu unsicherem Umgang mit den eigenen Daten und ist ein wenig "widersprüchlich" zum Yacy-Konzept. Natürlich muss man irgendwie eine höhere Verbreitung von Yacy erreichen und es Schmackhaft machen. Aber dann hätte man es auch mit dem "Free-Net"-Ansatz versuchen können.

Tor (der Onion-Router), bietet doch auch die Möglichkeit eines eigenen Webspaces.. Yacy arbeitet aber nicht auf diese Art oder?

Bitte entschuldigt meine kritische Art, ich will yacy auch nicht schlecht machen. Bin von Natur aus einfach nur misstrauisch. Für mich sollte dieser Suchdienst unabhängig von solchen Anwendungen sein. Denn wenn man sie über irgendeine Lücke exploiten kann und man als Yacy-Unterwegs ist. Kann man sehr schnell bei der Ausgabe der Suchergebnisse den "obersten Link" in einen Evil-Link verwandeln. Oder nicht?

Ich bin gerne Bereit hier viel Frei-Zeit zu investieren (ist einfach eine Interessante Sachen!) :) Habt ihr vielleicht Linktipps zu interessanten Threads die man gelesen-haben-muss? Dann Löcher ich euch auch nicht mehr mit solchen Anfänger-Fragen, versprochen :)

P.s: Meine Bedenken zur Minipulation der Suchergebnisse waren von der Art: "Konzern X, hat mehr Geld und setzt 3000 Virtuelle-Yacys auf und änder damit (irgendwie) die Anzahl der Suchergebnisse bzw Gewichtung".
ChrisJ
 
Beiträge: 8
Registriert: So Jul 27, 2008 5:19 pm

Re: Datenschutz-Problem?

Beitragvon DanielR » Di Jul 29, 2008 5:46 pm

ChrisJ hat geschrieben: Allerdings stoße ich gerade schon auf mein erstes kleines Problem. Ich habe lediglich SSH-Zugriff auf meinen "Yacy-PC" und ein "localhost:8080" ist da grade nicht drin.

Du kannst ja auch die IP des Server nehmen bzw. den Namen: meinserver.de:8080. Allerdings ist nur die ersten 10 Minuten nach dem starten der Zugriff per Administrator ohne Passwort möglich. Anschließend wird ein zufälliges Passwort gesetzt. Die Diskussion zur "neuen" Zugangsberechtigung findest du im Thread Admin-Autorisierung für localhost. Für Problemlösung gibt es den Thread Böse Falle für Neueinsteiger
DanielR
 
Beiträge: 395
Registriert: Di Feb 12, 2008 2:22 pm

Re: Datenschutz-Problem?

Beitragvon ChrisJ » Di Jul 29, 2008 5:56 pm

DanielR hat geschrieben:Du kannst ja auch die IP des Server nehmen bzw. den Namen: meinserver.de:8080.


Hat wunderbar geklappt :) Mich hat das nur irritiert das im wiki immer nur "localhost" stand. Und ich hatte mal Erfahrung mit Programmen die aus Sicherheistgründen.. den Zugriff ausschließlich über 127.0.0.1 zuließen...
ChrisJ
 
Beiträge: 8
Registriert: So Jul 27, 2008 5:19 pm

Re: Datenschutz-Problem?

Beitragvon Low012 » Di Jul 29, 2008 9:07 pm

Wenn du von außerhalb des eigenen Netzwerks auf YaCy zugreifen möchtest und dabei Daten nicht im Klartext übermitteln möchtest, ist wahrscheinlich auch

http://www.yacy-websuche.de/wiki/index.php/De:InterfaceÜberHTTPS

für dich interessant. URL per copy & paste (inkl. "ÜberHTTPS") in die Adressleiste des Browsers einfügen, phpBB kommt aus irgendwelchen Gründen nicht mit Umlauten klar.

edit: Das localhost:8080 stammt noch aus einer Zeit, als die Vision war, dass möglichst viele Leute die Software als Proxy auf ihrem persönlichen Rechner installieren und daher auch im häufigsten Fall über localhost drauf zugreifen. Mit localhost:8080 ist hier im Forum und auch im Wiki aber in fast allen Fällen eher allgemeiner <ip>:<port> gemeint.
Low012
 
Beiträge: 2214
Registriert: Mi Jun 27, 2007 12:11 pm

Re: Datenschutz-Problem?

Beitragvon Halborinda » Mi Jul 30, 2008 7:51 pm

Mir geht es darum, dass YaCy im Standard mehr Datenschutz betreibt und nicht unnötig Daten sammelt, obgleich das nicht notwendig ist.

Es gibt in meinen Augen keinen Grund, warum YaCy alle Proxy-Zugriffe in ein Log verewigt. Dass man es im Zweifelsfall anschalten kann, um Fehler zu finden, ist sehr nützlich.

Aber warum muss mach sich so tief mit den Dingen auseinander setzen, dass man weniger Daten sammelt?

Lotus hat geschrieben:Um die Logs zu deaktivieren sollte eine DATA/LOG/yacy.logging mit folgendem Inhalt reichen:
Code: Alles auswählen
.level=OFF

Die restlichen Levels müssen dann noch angepasst oder gelöscht werden.
In dieser Datei lässt sich auch der Proxy Log deaktivieren. (# Properties for the proxy access logger)


Würde es nicht reichen, alle personenbezogenen Daten im Standardfall nicht zu loggen? Anstatt dass man die Keule auspackt und nicht einmal Warnings und Errors zu loggen?

Lotus hat geschrieben:Zu den Cookies / HTCACHE gibt es hier schon eine Diskussion: viewtopic.php?p=1048


Und wiederholt stelle ich die Frage: Warum muss YaCy Cookie mitsniffen?! Es reicht nicht, nur die Oberfläche zu entfernen. Es gibt einfach keinen Grund, warum YaCy das Cookie ausliest und sich behält!

Es ist sinnvoll spezielle Seiten zu erkennen und bei Seiten mit Cookies anders vorzugehen. Aber dafür muss man nicht alle Cookies speichern, da reicht die Information: Diese Seite hatte ein Cookie, da kann ich nicht meinen Cache nutzen, sondern sollte selbst ohne Cookie anfragen.

YaCy hat das Cookie mit dem ich mich gegenüber eBay, Amazon etc. einlogge zu speichern.

Lotus hat geschrieben:An YaCy-Stats werden keine Informationen übertragen und es können auch keine Benutzer-Profile über Surfverhalten erstellt werden. Der Zuwachs an Links/Wörtern kann aus mehreren Quellen kommen für die selbst keine Aktion gestartet werden muss. Auf YaCystats ist lediglich ersichtlich was ohnehin schon auf der Peer-Liste in YaCy zu sehen ist.


Das spricht trotzdem nicht dagegen, dass man defensiver vorgehen könnte.
Zum Beispiel ein Opt-In... Dem Benutzer wird erklärt, was es bedeutet, wenn er alle seine Daten offenbart und auch dann ggf. zeigt, wann er online ist, wann er den Rechner an hat. Aber auch, dass es für die Community interessant ist, wie weit gediehen das Projekt ist, wie viele Server es gibt, wie viele Links... Etc.

Grüße
Halborinda
 
Beiträge: 217
Registriert: Sa Jul 07, 2007 7:58 am

Re: Datenschutz-Problem?

Beitragvon Halborinda » Mi Jul 30, 2008 8:08 pm

ChrisJ hat geschrieben:[...]Was mir "Sorgen" machte waren irgendwie die Data-Mining Möglichkeiten. Bei einer solchen Suchmaschine. Denn das (mögliche - wenn jemand Teile von yacy unbemerkt modifiziert) "Potential" der Überwachung ist hier evtl wesentlich größer als bei Google und Co.


Zumindest ist das ganze Open-Source und man hat die Chance, solche Änderungen zu entdecken. Was keine Garantie ist. Bei irgendeinen größeren PHP-Projekt hatte es Monate gedauert, aber bei einer Closed-Ware hast Du nur mit Debuggern die Chance... Das ist doch immerhin etwas...

ChrisJ hat geschrieben:Was mir nicht schmeckt ist halt der Blog und das Wiki und die File-Sharing-Möglichkeit. Wenn jemand einen Blog "irgendwo" schreibt erkennt man das nicht so schnell die Zusammenhänge (Man muss erst den Benutzernamen usw. "auflösen"). "Hier" hat kann man direkt an die IP des Nutzers, auf welchem Yacy läuft.. und kann an jede Menge andere pers. Informationen kommen ohne sich überhaupt "im LAN" oder Zugang auf einem dieser Rechner zu haben. Wenn man sich ansieht welche Informationen die "Familie" da hinterlegt. Und wer dann noch seine Fotos, Filme, Musik und Co dort veröffentlicht... Ich finde das verführt einfach zu unsicherem Umgang mit den eigenen Daten und ist ein wenig "widersprüchlich" zum Yacy-Konzept. Natürlich muss man irgendwie eine höhere Verbreitung von Yacy erreichen und es Schmackhaft machen. Aber dann hätte man es auch mit dem "Free-Net"-Ansatz versuchen können.


Ich kann nur dazu sagen, dass ich nicht verstehe, warum YaCy das überhaupt anbietet...

YaCy ist eine Suchmaschine... Blogs können andere besser... Und File-Sharing auch... Warum YaCy da mitmischen muss, habe ich noch immer nicht verstanden...

Aber Du kannst es deaktiveren bzw. einfach nicht nutzen.

ChrisJ hat geschrieben:Tor (der Onion-Router), bietet doch auch die Möglichkeit eines eigenen Webspaces.. Yacy arbeitet aber nicht auf diese Art oder?


Nein. YaCy bietet keine Anonymität. Tor bietet auch keinen Web-Space an, aber Du kannst über Tor anonymisiert einen eigenen Web-Server laufen lassen.

Zu Tor etc. schaut doch Mal dort vorbei: http://board.planetpeer.de/

Du kannst auch YaCy über Tor laufen lassen, indem Du Tor bzw. Privoxy als Proxy angibst, dann solltest Du aber bei YaCy unbedingt *.onion auf die Blackliste setzen.

Theoretisch kannst Du auch alle Tor-Seiten indizieren:
http://www.yacy-websuche.de/wiki/index.php/De:YaCy-Tor
Praktisch gibt es leider immer noch das Problem, dass für einen wichtigen Filter die Resourcen fehlen:
erweiterte Blacklistengine

ChrisJ hat geschrieben:Bitte entschuldigt meine kritische Art, ich will yacy auch nicht schlecht machen. Bin von Natur aus einfach nur misstrauisch. Für mich sollte dieser Suchdienst unabhängig von solchen Anwendungen sein. Denn wenn man sie über irgendeine Lücke exploiten kann und man als Yacy-Unterwegs ist. Kann man sehr schnell bei der Ausgabe der Suchergebnisse den "obersten Link" in einen Evil-Link verwandeln. Oder nicht?


Gesunder Menschenverstand, Misstrauen und Kritisches Denken könnte dieser Menschheit im Allgemeinen gerade in unseren Zeit der steigenden Überwachungsmaßnahmen nicht schaden... ;-/

ChrisJ hat geschrieben:P.s: Meine Bedenken zur Minipulation der Suchergebnisse waren von der Art: "Konzern X, hat mehr Geld und setzt 3000 Virtuelle-Yacys auf und änder damit (irgendwie) die Anzahl der Suchergebnisse bzw Gewichtung".


Das ist sicherlich ein interessanter Punkt... *G*
Halborinda
 
Beiträge: 217
Registriert: Sa Jul 07, 2007 7:58 am

Re: Datenschutz-Problem?

Beitragvon Halborinda » Mi Jul 30, 2008 8:14 pm

Orbiter hat geschrieben:der Proxy verwendet die Cookies nie! Sie werden nur gespeichert damit der User man sehen kann was eigentlich alles an Cookies umhergeschickt wird. Sollte der Proxy allerdings nicht für sich selbst benutzt werden, sondern für mehrere Leute, so sollten hier Datenschutzmechanismen greifen. D.h. das muss zumindest abschaltbar sein.

Ansonsten wäre ein Abschalten des Cookie-Loggings gleichbedeutend mit einem Abschalten der Anzeige der Cookies im eigenen Browser, ohne das eine Verwendung der Cookies geblockt wird. Es wird sich aber wohl niemand selber blind machen wollen, oder?


Die Motivation kann ich so jetzt verstehen.

Dennoch würde ich es besser finden, wenn es erst einmal standardmäßig deaktiviert ist und der Benutzer es als Opt-In aktivieren kann. Dann noch ein bisschen Text, was Cookies sind, und was man damit anstellen kann, wenn sie beispielsweise 100 Jahre gültig sind.

Aktuell ist YaCy ein Cookie-Sammler und das lässt sich nicht abschalten und dass finde ich sehr unangenehm.

Grüße
Halborinda
 
Beiträge: 217
Registriert: Sa Jul 07, 2007 7:58 am

Re: Datenschutz-Problem?

Beitragvon flori » Mi Jul 30, 2008 10:38 pm

Ich hab jetzt mal eine Option in svn 5028 eingebaut, mit der man die Cookie Überwachung ein- und ausschalten kann. Die Bedienung ist noch nicht ganz perfekt. Das werde ich aber noch morgen machen.
Die Option hab ich jetzt standardmßig ausgeschaltet.

Was mir noch aufgefallen ist: Die Cookies wurden nicht wie die Logs auf der Platte gespeichert. Sie sind als nach jedem Neustart wieder gelöscht.
flori
 
Beiträge: 245
Registriert: Mi Jun 27, 2007 10:17 pm
Wohnort: Karlsruhe

Re: Datenschutz-Problem?

Beitragvon ChrisJ » Do Jul 31, 2008 12:21 am

flori hat geschrieben:Was mir noch aufgefallen ist: Die Cookies wurden nicht wie die Logs auf der Platte gespeichert. Sie sind als nach jedem Neustart wieder gelöscht.


Das ist doch ganz gut.

flori hat geschrieben:Die Option hab ich jetzt standardmßig ausgeschaltet.


Aber nur "du" hast sie ausgeschaltet und es ist kein Standard von 5028 oder?

Was ich auch noch nicht verstanden habe ist das vorgehen der Blacklist. Wenn ich z.B auf dem selben Rechner mein Apache mit Wiki nicht indizieren lassen möchte, kann ich dann einfach "meinrechner.meinedomain/wiki/index.php/Hauptseite" auf die Blacklist setzen?. Angenommen dort laufen noch andere Dienste. Und ich will nicht das YaCy die anrührt kann ich dann einfach "meinrechner.meinedomain" in die Blackliste eintragen? Oder führt das zu Problemen.. weil YaCy genau auf dem System läuft?
In der Blacklist-Kontrolle ist auch vermerkt das man diese mit anderen Tauschen kann. Aber nicht muß. Wie deaktiviere ich die Möglichkeit das andere auf meine Zugreifen können?

Halborinda hat geschrieben:Zumindest ist das ganze Open-Source und man hat die Chance, solche Änderungen zu entdecken. Was keine Garantie ist. Bei irgendeinen größeren PHP-Projekt hatte es Monate gedauert, aber bei einer Closed-Ware hast Du nur mit Debuggern die Chance... Das ist doch immerhin etwas...

Nun ja aber könnte nicht jemand auf de Idee kommen, die Yacy-Version auf "seinem" Rechner so modifizieren das sie vielleicht gezielt Informationen über die anderen Peers sammelt und diese Abpseichert? Z.B eben über die ans P2P-Netz angefragten Suchbegriffe? Oder werden die nur mit dem Hashwert-verglichen usw.. so das das auch nicht zurück aufgelöst werden kann?
(Edit: Traurig aber wahr ist eigentlich das es keine Rolle Spielt, man kann ja auch mit eine normalen Suchmaschine Eindeutige Benutzerprofile erstellen. Schließlich hinterlässt jeder User eine Art Wasserzeichen seines Profiles durch seine Ausdrucksweisen, Interessen usw.. es ist fast schon sinnlos in YaCy einen solchen Schutzmechanismus einzubauen..)

Es folgt, leicht Off-Topic und ein paar Ideen:
Positiv aufgefallen ist der Traffic den mein YaCy erzäugt.. ein gewisses Grundrauschen das sozusagen mein "normales Internetverhaten" ein wenig darin Untergeht.

Eine Funktion die ich gerne hätte währe ein Checksummen-Check der Dateien von Yacy. Wobei das nicht hilft wenn jemand es schafft den bösen Code lediglich im Arbeitsspeicher zu halten. Ich mach mir sorgen das eine Art Wurm oder eine speziell hergerichtete Internetseite unseren Lieblingswahl krank macht. Ich weiß das Vertrauen von peer to peer ist unheimlich wichtig. Daher fände ich es interessant wenn man vielleicht den "Web of Thrust"-Ansatz irgendwie implementiert. Denn ich möchte nicht das irgendwann YaCy-Wahle in einem DDos-Bot-Netz schwimmen.

Was sind das eigentlich für Blacklisten die man mit anderen Tauschen kann, welchen ansatzt haben sie, und sollte ich eine Blackliste kopieren und damit den Wahl füttern?

Interessant währe auch wenn jeder User auf seinem YaCy Einstellungen entsprechende Konfigurationen vornehmem könnte, damit YaCy die Suchinhalte auf dem Client (und somit vor Ort)in das "Ranking der Suchtreffer" einbeziehen könnte (Mir sind bis jetzt die Suchergebnisse noch zu schlecht, aber vielleicht liegt das daran das mein Wahl sich noch nicht warm-ge-schwommen hat. ;). Google macht ja solche Tricks wie den Link Speichern auf den man nach der Suche klickt. Das finde ich schlimm, ist aber gerade für ein besseres Ergebnis Unabdingbar. Interessant fände ich eine Art anonyme Möglichkeit wenn der User diese Daten auf seinem Client hat (oder USB-Stick zum mitnehmen).. und auch verschlüsselt usw. Und man es trotzdem mit Freunden oder "Web of Trust"-Partnern "teilen" könnte. Oder man mit verschiedenen "Rollen oder Ranking-Profielen" sucht. Wichtig ist aber das dann dieses Ranking auf dem Client, unabhängig und anonym (den anderen Yacy-Nodes Verborgen) von statten geht. Und er sozusagen die "getroffenen Seiten" nochmal Filtert, was die Suche natürlich nicht verkürzt, aber die Ergebnisse vielleicht besser macht.
ChrisJ
 
Beiträge: 8
Registriert: So Jul 27, 2008 5:19 pm

Re: Datenschutz-Problem?

Beitragvon DanielR » Do Jul 31, 2008 1:49 pm

flori hat geschrieben:Was mir noch aufgefallen ist: Die Cookies wurden nicht wie die Logs auf der Platte gespeichert. Sie sind als nach jedem Neustart wieder gelöscht.

Das ist wohl so gewollt. Nur die laufenden Cookies werden/wurden angezeigt.

@ChrisJ: Der Wal wird ohne 'h' geschrieben :idea:

ChrisJ hat geschrieben:
flori hat geschrieben:Die Option hab ich jetzt standardmßig ausgeschaltet.

Aber nur "du" hast sie ausgeschaltet und es ist kein Standard von 5028 oder?

Doch mit "standardmäßig" meint er als default für YaCy.
DanielR
 
Beiträge: 395
Registriert: Di Feb 12, 2008 2:22 pm

Re: Datenschutz-Problem?

Beitragvon Lotus » Do Jul 31, 2008 2:21 pm

ChrisJ hat geschrieben:Wenn ich z.B auf dem selben Rechner mein Apache mit Wiki nicht indizieren lassen möchte, kann ich dann einfach "meinrechner.meinedomain/wiki/index.php/Hauptseite" auf die Blacklist setzen?. Angenommen dort laufen noch andere Dienste. Und ich will nicht das YaCy die anrührt kann ich dann einfach "meinrechner.meinedomain" in die Blackliste eintragen? Oder führt das zu Problemen.. weil YaCy genau auf dem System läuft?
In der Blacklist-Kontrolle ist auch vermerkt das man diese mit anderen Tauschen kann. Aber nicht muß. Wie deaktiviere ich die Möglichkeit das andere auf meine Zugreifen können?

Das macht natürlich keine Probleme. Sieh dir die Blacklist-Seite noch einmal genauer an. Da gibt es Optionen wie "share/don't share this list" und "Import blacklist items from..."
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: Datenschutz-Problem?

Beitragvon Vega » Do Jul 31, 2008 6:21 pm

Ich will ja nichts sagen, aber bevor hier umfassend über die Blacklistfunktion philosophiert wird....

http://forum.yacy-websuche.de/viewtopic.php?f=5&t=1156

@ChrisJ - trotzdem lohnt sich yacy, man lernt eine ganze Menge dabei und Spaß macht es außerdem :-).

Gruß,
Thomas
Vega
 
Beiträge: 824
Registriert: Mi Jun 27, 2007 3:34 pm
Wohnort: Dresden


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast