Liste von seiten zu crawl

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

Liste von seiten zu crawl

Beitragvon datamove » Mi Dez 01, 2010 1:37 pm

Hallo,

Ich habe ein grosse Liste von seiten in ein Text Datei zu crawl (privat mode). Ich versuchte "Index creation"->Crawl Start (Expert)->From file und mein Datei mit URLs, aber geht das simlich nicht. Nur when ich einzelne URL eintragen in der From URL Felde, geht crawling...

Oder bin ich ganz falsh und muss etwas aenderes mahen?

MfG
Artem
datamove
 
Beiträge: 3
Registriert: Fr Apr 09, 2010 1:30 pm

Re: Liste von seiten zu crawl

Beitragvon Low012 » Mi Dez 01, 2010 4:32 pm

Wenn ich mich richtig erinnere, muss die Datei eine HTML-Datei sein oder zumindest müssen die URLs in <a href="http://example.org"></a> stehen. Ganz sicher bin ich aber nicht.
Low012
 
Beiträge: 2214
Registriert: Mi Jun 27, 2007 12:11 pm

Re: Liste von seiten zu crawl

Beitragvon datamove » Fr Dez 03, 2010 9:32 am

Vielen Dank! Mit <a> tags war ok!
datamove
 
Beiträge: 3
Registriert: Fr Apr 09, 2010 1:30 pm

Re: Liste von seiten zu crawl

Beitragvon Orbiter » Do Dez 09, 2010 6:18 pm

mit svn 7367 sollte das nun auch von reinen Textdateien gehen.
Orbiter
 
Beiträge: 5797
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste

cron