Einstellungen Intranet-Indexierung

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

Einstellungen Intranet-Indexierung

Beitragvon Pit » Fr Feb 19, 2010 9:33 am

Hallo,
ich suche bislang erfolglos eine Anleitung, welche Einstellungen für eine reine Intranet-Indexierung zu machen sind. Weder in der YaCy-Wiki noch hier wurde ich fündig. Möglicherweise verwende ich auch die falschen Suchbegriffe.
Auf der Seite CrawlStart habe ich als Startpunkt "http://mein-Intranetserver", darunter sehe ich einen grünen Haken, was für mich bedeutet, dass der Eintrag korrekt ist. Im Muss-Filter steht bei mir ".*" , die Crawling-Tiefe=6. Die restlichen Angaben habe ich belassen. Dennoch ergibt der Crawl keine Treffer. Warum nicht?

Auf der Seite Eingangskonfiguration habe ich "Intranet Idexierung" ausgewählt. Das Feld darunter für den Netzwerkpfad habe ich leer gelassen. Später habe ich in diesem Feld einen Pfad eingegeben, was ebenfalls keinen Erfolg brachte. Nun wollte ich den eingegebenen Pfad wieder rausnehem, aber nach dem Entfernen erzeugt ein Klick auf den Speicherbutton eine reproduzierbare Java-Fehlermeldung.

Ich fände es schön, wenn ich etwas Unterstützung finden würde.
Danke schon mal im Voraus
Pit
Pit
 
Beiträge: 4
Registriert: Fr Feb 19, 2010 8:49 am

Re: Einstellungen Intranet-Indexierung

Beitragvon Lotus » Fr Feb 19, 2010 10:04 am

Da kann es mehrere Ursachen geben die mir einfallen:
1) Der Intranet-Server hat keine Intranet-IP-Adresse
2) dort gibt es dynamische Seiten, die per Crawl-Einstellung nicht verfolgt werden (mit "?" in der Adresse)
3) für den Zugriff ist eine Authentifizierung nötig (das macht YaCy nicht)
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: Einstellungen Intranet-Indexierung

Beitragvon Orbiter » Fr Feb 19, 2010 10:12 am

guck auch mal in /IndexCreateParserErrors_p.html (vorher auf aktuelle Version 0.94 updaten) nachdem du den Crawl gestartet hast. Dort sollte eigentlich drin stehen warum URLs als nicht indexierbar/nicht crawlbar abgelehnt wurden.
Orbiter
 
Beiträge: 5796
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Einstellungen Intranet-Indexierung

Beitragvon Pit » Fr Feb 19, 2010 10:58 am

Orbiter hat geschrieben:guck auch mal in /IndexCreateParserErrors_p.html (vorher auf aktuelle Version 0.94 updaten) nachdem du den Crawl gestartet hast. Dort sollte eigentlich drin stehen warum URLs als nicht indexierbar/nicht crawlbar abgelehnt wurden.


Orbiter, danke für deine Antwort. Auf yacy.net finde ich nur die V 0.91 (Windows), die ich auch aktuell einsetze. Wo finde ich denn die 0.94?
Pit
 
Beiträge: 4
Registriert: Fr Feb 19, 2010 8:49 am

Re: Einstellungen Intranet-Indexierung

Beitragvon Pit » Fr Feb 19, 2010 11:04 am

Lotus hat geschrieben:Da kann es mehrere Ursachen geben die mir einfallen:
1) Der Intranet-Server hat keine Intranet-IP-Adresse
2) dort gibt es dynamische Seiten, die per Crawl-Einstellung nicht verfolgt werden (mit "?" in der Adresse)
3) für den Zugriff ist eine Authentifizierung nötig (das macht YaCy nicht)


Hallo Lotus,
danke für deine Tipps.
zu 1) Er hat eine IP, pingbar, auflösbar, alles Bestens.
zu 2) Ich setze PHP, .Net, aber auch statisches HTML ein. Letzteres sollte doch gefunden werden, oder?
zu 3) YaCy startet auf dem Server im System-Account und hat alle Rechte auf die Server-Ressourcen. Daran kann es imho auch nicht liegen.
Wo könnte ich denn dieses Thema ausführlich nachlesen oder sollte ich als YaCy-Rookie noch an anderer Stelle in der Konfiguration nachschauen?
Pit
 
Beiträge: 4
Registriert: Fr Feb 19, 2010 8:49 am

Re: Einstellungen Intranet-Indexierung

Beitragvon lulabad » Fr Feb 19, 2010 11:15 am

Pit hat geschrieben:Orbiter, danke für deine Antwort. Auf yacy.net finde ich nur die V 0.91 (Windows), die ich auch aktuell einsetze. Wo finde ich denn die 0.94?

Über die eingebaute Updatefunktion oder manuell von http://www.yacystats.de/yacybuild/
lulabad
 
Beiträge: 709
Registriert: Mi Jun 27, 2007 11:40 am
Wohnort: Im Herzen Bayerns

Re: Einstellungen Intranet-Indexierung

Beitragvon Pit » Fr Feb 19, 2010 1:08 pm

lulabad hat geschrieben:Über die eingebaute Updatefunktion oder manuell von http://www.yacystats.de/yacybuild/


Heissa, es tuuut.
Wunderbar, nach dem manuellen Update auf Version 0.94 crawlt er wie ein Weltmeister. Danke lulabad für den Hinweis auf die neue Version. Auch der Java-Fehler ist weg.

Dank an euch für die perfekte Unterstützung.
Pit
Pit
 
Beiträge: 4
Registriert: Fr Feb 19, 2010 8:49 am


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste