MediaWiki-Surrogat-Import Problem

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

MediaWiki-Surrogat-Import Problem

Beitragvon Crystalgazer » Do Aug 13, 2015 7:42 am

Hallo zusammen,

ich (YaCy-Newbie) befasse mich gerade ziemlich intensiv mit YaCy und bin reichlich beeindruckt von der Suchmaschine :) .

Besonders angetan hat mich die Surrogate Import Funktion, doch genau da habe ich schon mein erstes Problem :( .

Ich bin der Anleitung gefolgt und habe mir einen aktuellen Mediawikidump downgeloadet, extrahiert und in ein "Mediawikidump" Verzeichnis unter Yacy\Data\Mediawikidump kopiert.

Danach habe ich die MediaWiki Dump Import Funktion aufgerufen. YaCy legt los und fängt mit der Datenkonvertierung an.
Es erscheint eine Datei *0.xml.prt in Surrogates\In
Laut Beschreibung sollte nun der Indexer gestartet werden.
Aber da tut sich im System-Status Fenster nix :( . Nach einer Weile erscheint dann in Surrogates\Out ein gepackte *0.XML.gz-Datei.
Nach Wikipedia Einträgen kann ich nicht suchen und im Index-Browser befindet sich kein Wikipedia-Eintrag.
Mittlerweile stehen 57 XML Dateien in Surrogates\Out aber im Index ist nichts von Wikipedia zu finden.

Ich weiß hier nicht mehr weiter. Was mache ich hier falsch? :roll:

YaCY Version dev1.83/9316

Gruß Alex
Crystalgazer
 
Beiträge: 10
Registriert: Mi Aug 12, 2015 8:38 pm

Re: MediaWiki-Surrogat-Import Problem

Beitragvon Crystalgazer » Do Aug 13, 2015 12:31 pm

In der Version main 1.8/9000 funzt es !

Allerdings legt die Installationsroutine keinen Pfad Yacy\Data\Surrogates\out an. Indexiert dafür aber die Surrogatdatei korrekt. :?

Merkwürdig...

Gruß Alex
Crystalgazer
 
Beiträge: 10
Registriert: Mi Aug 12, 2015 8:38 pm

Re: MediaWiki-Surrogat-Import Problem

Beitragvon Orbiter » Mo Aug 31, 2015 12:25 pm

der out-ordner war zwischenzeitlich deaktiviert, in der aktuellen dev-Version ist der wieder vorhanden.
Orbiter
 
Beiträge: 5769
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: MediaWiki-Surrogat-Import Problem

Beitragvon Crystalgazer » Di Sep 01, 2015 2:10 pm

Mittlerweile habe ich mich hier auf die Version dev 1.83/9250 eingeschossen.

Die Problematik mit dem fehlenden Surrogates\Out Verzeichnis ist mir bei den Versuchen mit höheren Versionen als 1.8/9000 auch aufgefallen. Ein manuelles Anlegen des Surrogates\Out Verzeichnisses brachte aber auch nicht den gewünschten Erfolg.

Mit keiner Version (außer der 1.8/9000) die ich bisher getestet habe, ist mir ein Mediawiki Import gelungen. :( .
Im Übrigen auch nicht unter Linux!.
Als Workaround habe ich nun unter der 1.83/9250 die Mediawikidaten der 1.8/9000 über die Surrogates Importfunktion eingelesen.

Zumindest der Import über diesen Weg funzt gut :) . Schöner wäre es natürlich wenn es eine Lösung für das direkte Importieren innerhalb der 1.83/9250 geben würde...

Gruß Alex
Crystalgazer
 
Beiträge: 10
Registriert: Mi Aug 12, 2015 8:38 pm


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: Exabot [Bot] und 1 Gast

cron