Datenschutzproblem automatisch Indexierung?

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

Datenschutzproblem automatisch Indexierung?

Beitragvon brezelbub » So Nov 15, 2009 10:43 pm

Wenn ich alle Seiten die ich besuche automatisch indexieren lasse, entsteht in der Datenbank eine lückenlose Chronik über mein Surfverhalten. Im Zweifel könnte diese sogar gegen mich verwendet werden, beispielsweise bei staatsanwaltschaftlichen Ermittlungen. Sollte man insofern nicht auf eine automatisch Indexierung verzichten?
brezelbub
 
Beiträge: 3
Registriert: So Nov 15, 2009 10:23 pm

Re: Datenschutzproblem automatisch Indexierung?

Beitragvon Lotus » Mo Nov 16, 2009 7:09 am

Es kann nicht von einer indexierten Seite auf einen Browser-Besuch dieser geschlossen werden.
Weiterhin ist das Logging einstellbar (im Verzeichnis <yacy>/DATA/LOG/... nachsehen).

Bei weiteren Fragen, gerne hier.
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: Datenschutzproblem automatisch Indexierung?

Beitragvon Orbiter » Mo Nov 16, 2009 9:18 am

mal abgesehen davon dass das natürlich nur passiert wenn du explizit YaCy als Proxy konfigurierst, das also nur durch deinen ausdrücklichen Wunsch passiert, ist es so, dass Webseiten die in YaCys Index sind NICHT mit einem Herkunftsmerkmal versehen sind. Es gibt ja inzwischen 7 Möglichkeiten, Daten in den Index zu bekommen (crawlen, remote crawlen, receipt von remote crawlen, proxy, suchergebnisse, dht Verteilung, Surrogate) und diese sind nur temporär kategorisiert und in http://localhost:8080/CrawlResults.html sichtbar, eine Speicherung dieser Quellen im File wird NICHT vorgenommen. D.h. es gibt gar keine eindeutigen Spuren, sondern nur ein Gemenge von verschiedenen Quellen.

Nochmal ganz deutlich: die Metadaten-Tabelle und der Index haben KEIN Feld um die Herkunft des Indexes zu speichern. Es gibt auch kein anderes Merkmal. Es ist nach Löschen des RAM (Neustart etc) NICHT mehr nachvollziehbar, dass die Daten im Index durch Proxy-Benutzung entstanden.
Orbiter
 
Beiträge: 5796
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Datenschutzproblem automatisch Indexierung?

Beitragvon brezelbub » Mi Nov 18, 2009 3:32 pm

Okay, aber was ist mit den Spuren auf der Gegenseite, also den Logfiles des Servers der indexiert wird? Das ist ja auch ein Problem was seit längerer Zeit in Verbindung mit Firefox-Prefetching diskutiert wird:
http://www.datenschutzbeauftragter-online.de/firefox-prefetching-abschalten/

Was ist wenn YaCy über Links automatisiert weitergecrawlt wird, und deswegen meine IP im Logfile einer Website auftaucht die z. B. auf von der Leyens böser Liste steht?

Mache mir halt Gedanken über mögliche Konsequenzen…
brezelbub
 
Beiträge: 3
Registriert: So Nov 15, 2009 10:23 pm

Re: Datenschutzproblem automatisch Indexierung?

Beitragvon Lotus » Do Nov 19, 2009 8:16 pm

YaCy sendet ohne Proxy den yacybot-User-Agent. Daran sollte erkenntlich sein, dass es automatische Aufrufe sind.
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: Datenschutzproblem automatische Indexierung?

Beitragvon brezelbub » Mo Nov 23, 2009 4:29 pm

Trotzdem wird dann ja meine IP übermittelt, der User Agent Header ist ja kein eindeutiges Kriterium, da er leicht fälschbar ist.

Spricht irgend etwas dagegen, die Indexierung über YaCy in Verbindung mit einem Anonymisierer abzuwickeln, beispielsweise einen VPN-Tunnel? Oder führt das zu Problemen?
brezelbub
 
Beiträge: 3
Registriert: So Nov 15, 2009 10:23 pm

Re: Datenschutzproblem automatisch Indexierung?

Beitragvon Low012 » Mo Nov 23, 2009 6:14 pm

Ich denke, so lange wie der Anonymisierer für YaCy transparent ist, dürfe es, soweit ich sehen kann, keine Probleme geben.
Low012
 
Beiträge: 2214
Registriert: Mi Jun 27, 2007 12:11 pm

Re: Datenschutzproblem automatisch Indexierung?

Beitragvon Lotus » Mo Nov 23, 2009 6:51 pm

Vielleicht hat das die Frage noch nicht ganz geklärt;
YaCy kann angewiesen werden, einen Proxy zu benutzen. Das könnte z.B. ein "Anonymisierer" sein.
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: Datenschutzproblem automatisch Indexierung?

Beitragvon Quix0r » Mi Mär 17, 2010 10:33 pm

Dazu muss aber das proxyaccess*.log (*hust*) aus. :)

Code: Alles auswählen
de.anomic.http.server.HTTPDProxyHandler.logging.enabled = FALSE

... in DATA/LOG/yacy.logging sollte reichen.
Quix0r
 
Beiträge: 1345
Registriert: Di Jul 31, 2007 9:22 am
Wohnort: Krefeld


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: Google [Bot] und 2 Gäste