Grundlegendes

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

Grundlegendes

Beitragvon P1750 » Sa Jun 01, 2013 3:07 pm

Hab gerade zum ersten Mal YaCy ausprobiert und finde die "Veranstaltung" recht interessant.

Beim Crawlen meiner eigenen Seite wurden aber quasi sämtliche Einstellungen ignoriert, die sonst funktionieren wie gewünscht.

Beispiele:
- Domain OHNE www (Tante "G" nennt das bevorzugte URL)
- zusätzlich (siehe oben) gibt's bei mir die "cannonial-URL", ebenso ignoriert
- noindex, nofollow etc. ignoriert
- robots.txt ignoriert (Medien, wenn ich richtig geschaut habe)

Hmmmm, soweit so schlecht, wäre ja cool, wenn man quasi Tante "G" spielen könnte insofern, dass deren Verhalten simuliert wird, denn so könnte ich mir das sogar als Check-Tool für fertige Projekte vorstellen, quasi mal nachzuschauen, ob alles läuft wie gewünscht oder etwas übersehen wurde abzudichten.

Hab ich hierbei einen "Denkfehler im Ansatz" oder schlicht irgendwelche Einstellungen nicht zu Kenntnis genommen, denn für obigen Zweck fände ich es quasi schon fast bombig.

Grüsse, in der Hoffnung auf Erleuchtung der Finsternis ;-)
P1750
 
Beiträge: 1
Registriert: Sa Jun 01, 2013 2:56 pm

Re: Grundlegendes

Beitragvon Orbiter » So Jun 02, 2013 1:22 pm

hallo!
welche URL hast du denn zum Starten genommen? "die sonst funktionieren wie gewünscht" interpretiere ich so: geht sonst, nur diese URL nicht.
robots.txt sollten selbstverständlich beachtet werden, wenn nicht muss es gefixt werden. Bitte daher ein Beispiel, gerne auch per PN wenns nicht öffentlich sein soll.
Orbiter
 
Beiträge: 5798
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Grundlegendes

Beitragvon Lotus » Fr Jun 07, 2013 12:15 pm

P1750 hat geschrieben:- noindex, nofollow etc. ignoriert

Das ist auch korrekt. Ob indexiert wird, wird von der Seite entschieden, die verlinkt ist. Maßgebend sind robots.txt und Metatags. Eine sehr alte Diskussion: viewtopic.php?f=6&t=1183
Diese Parameter hat Google für sich eingeführt, um Pagerank nicht zu vererben. Das ist nicht relevant für YaCy.
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste

cron