Anfänger-Frage zum Betrieb / Crawlen / Recht

Keine Scheu, hier darf alles gefragt und diskutiert werden. Das ist das Forum für YaCy-Anfänger. Hier kann man 'wo muss man klicken' fragen und sich über Grundlagen zur Suchmaschinentechnik unterhalten.
Forumsregeln
Hier werden Fragen beantwortet und wir versuchen die Probleme von YaCy-Newbies zu klären. Bitte beantwortete Fragen im YaCy-Wiki http://wiki.yacy.de dokumentieren!

Anfänger-Frage zum Betrieb / Crawlen / Recht

Beitragvon dino » Mo Jan 13, 2014 9:00 am

Ich bin seit dem Wochenende Anwender von Yacy, und hab zu folgenden Fragen keine bzw. keine eindeutige Antwort im Wiki gefunden:

Ist es zwingend notwendig, unter http://localhost:8090/CrawlStartSite_p.html eine Start-URL einzugeben?
- Was ist der Vorteil?
- Sollte man mehrere URL eigeben?
- Was habt ihr dort eingetragen?

Wenn man nichts einträgt, beginnt Yacy trotzdem mit dem crawlen?
- oder berücksichtigt Yacy "beim surfen" automatisch welche Seiten ich besuche, um diese in den Index aufzunehmen?
- muss ich dazu was einstellen?

Rechtliches:
- Wenn der Peer nicht von aussen erreichbar ist, kann es im Extremfall rechtliche Probleme geben, wenn ich den Crawler auf Reise schicke?
- Wenn der Peer von aussen erreichbar ist, wie sieht es dann aus? Könnte man urheberrechtliche Probleme bekommen? Der Webmaster kann zwar mit robots.txt bestimmen was gecrawlt werden darf, aber man weis - vor allem in Deutschland - ja nie ...
- gibt es hierzu Literatur oder sonstige Hinweise, wo man sich einlesen kann?

Viele Grüße
Dino
dino
 
Beiträge: 10
Registriert: Mo Jan 13, 2014 8:47 am

Re: Anfänger-Frage zum Betrieb / Crawlen / Recht

Beitragvon Orbiter » Mo Jan 13, 2014 10:31 am

Hallo Dino, willkommen!

Deine Fragen:

- Ist es zwingend notwendig, unter http://localhost:8090/CrawlStartSite_p.html eine Start-URL einzugeben?
nein. Aber das ist die Quelle dessen was du und alle anderen finden können. Würde das niemand machen, gäbe es keine Inhalte. Du kannst hier mitbestimmen was im Index ist. Genau da. Wir können dir nicht vorgeben welche Inhalte du da eintragen sollst, das soll ja mit Absicht nicht durch uns gelenkt werden. Du bist derjenige der den Inhalt lenkt!

- Wenn man nichts einträgt, beginnt Yacy trotzdem mit dem crawlen?
nein

- oder berücksichtigt Yacy "beim surfen" automatisch welche Seiten ich besuche, um diese in den Index aufzunehmen?
nein, nur wenn du YaCy als proxy im Browser konfigurierst. Aber auch das musst du nicht machen.

- Wenn der Peer nicht von aussen erreichbar ist, kann es im Extremfall rechtliche Probleme geben, wenn ich den Crawler auf Reise schicke?
Wir können dir hier keine Rechtsberatung geben, nur eine Meinung. Das hat erst mal nichts mit 'von aussen erreichbar' zu tun. Meine Meinung: bislang gibt es in Deutschland keinen mir bekannten Fall, wo das 'surfen', also Herunterladen von Webseiten ein Rechtsverstoss entstehen kann. Allerdings ist dieser Zustand nun durch diesen RedTube-Fall ein wenig in Schieflage geraten; wenn der Gesetzgeber hier nicht bald mal Klartext redet ist es kein Wunder dass alle verunsichert sind. Auch das Thema Vorratsdtenspeichung und Websperren wären 'Makel' an dieser Situation. Mit anderen Worten: ich weiss es nicht. Oder anders ausgedrückt: wenn das, was Google macht nicht jeder Mensch auch darf, dann ist hier was falsch.

- Wenn der Peer von aussen erreichbar ist, wie sieht es dann aus? Könnte man urheberrechtliche Probleme bekommen? Der Webmaster kann zwar mit robots.txt bestimmen was gecrawlt werden darf, aber man weis - vor allem in Deutschland - ja nie ...
Es gibt m.E. nach keinen Zusammenhang zwischen robots.txt und Urheberrecht. Es ist sogar so, dass natürlich jede Webseite dem Urheberrecht des Urhebers unterliegt, so definiert sich das so. Du darfst nie das, was jemand publiziert, einfach unter eigenen Namen wieder-Publizieren, es sei denn, der räumt dir das Recht dazu ein. Das macht aber die robots.txt nicht. Eine Ausnahme zum Urheberrecht stellen die 'Snippets' (Suchtrefferanzeige) dar, die rechtlich gesehen Kleinzitate sind.

- gibt es hierzu Literatur oder sonstige Hinweise, wo man sich einlesen kann?
Zum Urheberrecht im Umfeld von Suchmaschinen? Das wüsste ich auch gerne. Wer weiss mehr?
Orbiter
 
Beiträge: 5792
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Anfänger-Frage zum Betrieb / Crawlen / Recht

Beitragvon Yududi » Mo Jan 13, 2014 10:44 am

Mal ein Vorschlag weils passt:
Man könnte sich doch mit Suma e.V. zusammentun und einen Fond gründen wenn es rechtlich möglich ist in dem YaCy Betreiber und Freiwillige etwas einzahlen können vielleicht sogar jedes Jahr mit Dauerauftrag einen kleinen Betrag. Sollte dann irgendwann irgendein YaCy Mitglied einmal rechtlich belangt werden könnte der Fond benutzt werden. Und wenn es dann noch eine stillschweigende Vereinbarung gibt wo sich alle YaCy Betreiber in dem Fall gegenseitig helfen das wäre prima.

Es gibt m.E. nach keinen Zusammenhang zwischen robots.txt und Urheberrecht.

Ich glaube da besteht einer.
Yududi
 
Beiträge: 64
Registriert: Di Dez 10, 2013 12:30 pm


Zurück zu Hilfe für Einsteiger und Anwender

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 1 Gast

cron