Crawl endet nach zwei Einträgen

Keine Scheu, hier darf alles gefragt und diskutiert werden. Das ist das Forum für YaCy-Anfänger. Hier kann man 'wo muss man klicken' fragen und sich über Grundlagen zur Suchmaschinentechnik unterhalten.
Forumsregeln
Hier werden Fragen beantwortet und wir versuchen die Probleme von YaCy-Newbies zu klären. Bitte beantwortete Fragen im YaCy-Wiki http://wiki.yacy.de dokumentieren!

Crawl endet nach zwei Einträgen

Beitragvon berni » Fr Mär 23, 2012 9:16 am

Ich hab' kürzlich mal testweise YaCy installiert (unter debian) und auf meiner Webseite (www.croco-puzzle.com) ausprobiert. Der Crawl liest die Startseite, ein Bild und tut dann nix mehr. Hat jemand eine Idee, was das Problem sein könnte?

PS: Ich habe auf der YaCy-Webseite recht viele Video-Dokus gefunden, mit denen ich so meine Probleme habe (mein Browser zeigt die Videos nicht; aber selbst wenn er sie zeigen würde, weiß ich aus Erfahrung, dass bei mir fast nichts hängen bleiben würde). Gibt es auch ein schriftliches Tutorial? (Das Wiki hab' ich schon entdeckt, das war zumindest schon ein Anfang...)
berni
 
Beiträge: 11
Registriert: Fr Mär 23, 2012 9:11 am

Re: Crawl endet nach zwei Einträgen

Beitragvon Lotus » Fr Mär 23, 2012 4:54 pm

Kann ich nachstellen. Im Log gibt es dazu nur einen cache hit Eintrag.
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: Crawl endet nach zwei Einträgen

Beitragvon berni » Sa Mär 24, 2012 8:23 am

Mir ist eingefallen, dass ich auf der Webseite ein <nobr>-Element verwende, was ja kein offizieller HTML-Standard ist. Aber auch ohne habe ich das selbe Ergebnis. Daran scheint es also nicht zu liegen...
berni
 
Beiträge: 11
Registriert: Fr Mär 23, 2012 9:11 am

Re: Crawl endet nach zwei Einträgen

Beitragvon Jazzy » Sa Mär 24, 2012 11:44 am

Ich bin zwar kein Entwickler aber möglicherweise liegt es daran, dass deine Webseite keine robots.txt hat?
Jazzy
 
Beiträge: 36
Registriert: Mo Okt 31, 2011 5:29 pm

Re: Crawl endet nach zwei Einträgen

Beitragvon berni » Sa Mär 24, 2012 9:13 pm

Jazzy hat geschrieben:Ich bin zwar kein Entwickler aber möglicherweise liegt es daran, dass deine Webseite keine robots.txt hat?


Ich probier's mal; aber ich dachte bislang, dass die robots.txt nur Einschränkungen definiert...
berni
 
Beiträge: 11
Registriert: Fr Mär 23, 2012 9:11 am

Re: Crawl endet nach zwei Einträgen

Beitragvon Lotus » So Mär 25, 2012 9:16 am

Sollte auch nicht daran liegen.
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: Crawl endet nach zwei Einträgen

Beitragvon berni » Fr Apr 06, 2012 8:18 pm

Scheint sich irgendwie niemand recht für zu interessieren. :( Ich werd' yacy erst mal wieder deinstallieren, weil so nutzt es mir herzlich wenig. Vielleicht hat ja in ein paar Monaten jemand den Fehler behoben.
berni
 
Beiträge: 11
Registriert: Fr Mär 23, 2012 9:11 am

Re: Crawl endet nach zwei Einträgen

Beitragvon Vega » Fr Apr 06, 2012 9:51 pm

Hallo Berni,

das stimmt so nicht, Michael - der den Crawler geschrieben hat - ist noch ein paar Wochen am andern Ende der Welt unterwegs, und die anderen die Java im Schlaf sprechen sind beruflich aktuell recht bussy. Daher dauert es manchmal eine Weile ehe so ein Bug gefixt wird. Sorry, wir machen das alles in unserer eh schon knappen Freizeit, ein paar mehr Schultern die das ganze Projekt mittragen wären wirklich hilfreich/willkommen. Ich mach einen Bug Report dazu - schau halt immer mal in den Bugtracker ob sich da etwas tut.
Hier der Link zum von mir angelegtem Bug-Eintrag: http://bugs.yacy.net/view.php?id=182

Gruß,
Thomas

berni hat geschrieben:Scheint sich irgendwie niemand recht für zu interessieren. :( Ich werd' yacy erst mal wieder deinstallieren, weil so nutzt es mir herzlich wenig. Vielleicht hat ja in ein paar Monaten jemand den Fehler behoben.
Vega
 
Beiträge: 824
Registriert: Mi Jun 27, 2007 3:34 pm
Wohnort: Dresden

Re: Crawl endet nach zwei Einträgen

Beitragvon berni » Sa Apr 07, 2012 6:56 am

Vega hat geschrieben:das stimmt so nicht, Michael - der den Crawler geschrieben hat - ist noch ein paar Wochen am andern Ende der Welt unterwegs, und die anderen die Java im Schlaf sprechen sind beruflich aktuell recht bussy. Daher dauert es manchmal eine Weile ehe so ein Bug gefixt wird. Sorry, wir machen das alles in unserer eh schon knappen Freizeit, ein paar mehr Schultern die das ganze Projekt mittragen wären wirklich hilfreich/willkommen. Ich mach einen Bug Report dazu - schau halt immer mal in den Bugtracker ob sich da etwas tut.


Oh, das wusste ich nicht. Danke dir für die Info; ich werde ab und an in den Bugtracker schauen. Ich hatte auch schon überlegt, ob ich die Sourcen selber nach dem Bug durchsuchen will, aber mir sind andere Dinge einfach wichtiger; das würde, selbst wenn ich es auf meine persönliche ToDo-Liste schreiben würde, vermutlich nie umgesetzt werden.
berni
 
Beiträge: 11
Registriert: Fr Mär 23, 2012 9:11 am

Re: Crawl endet nach zwei Einträgen

Beitragvon berni » Sa Apr 07, 2012 3:24 pm

Vielleicht war es ganz gut, dass ich yacy gestern entfernt habe; das tut nämlich nicht richtig: nach einem "purge" war das Script "/etc/init.d/yacy" immer noch da und schimpft dann beim Starten des Computers. Auch /var/lib/yacy; da bin ich mir aber nicht sicher, ob man das so will. Ich glaube aber, bei einem purge sollte auch das gelöscht werden.
berni
 
Beiträge: 11
Registriert: Fr Mär 23, 2012 9:11 am

Re: Crawl endet nach zwei Einträgen

Beitragvon Orbiter » Mi Apr 18, 2012 9:31 am

berni hat geschrieben:Ich hab' kürzlich mal testweise YaCy installiert (unter debian) und auf meiner Webseite (http://www.croco-puzzle.com) ausprobiert. Der Crawl liest die Startseite, ein Bild und tut dann nix mehr. Hat jemand eine Idee, was das Problem sein könnte?


fix ist in https://gitorious.org/yacy/rc1/commit/4 ... e25a064c72
Orbiter
 
Beiträge: 5792
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main


Zurück zu Hilfe für Einsteiger und Anwender

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste