Hostbrowser: Ergänzende Möglichkeiten

Ideen und Vorschläge sind willkommen.

Hostbrowser: Ergänzende Möglichkeiten

Beitragvon PCA42 » Sa Nov 17, 2012 6:25 pm

Ich hab mal mit dem Hostbrowser rumgespielt. Die Möglichkeit eines "Delete" gibt es ja schon. Kann vielleicht auch ein Button für "Add to blacklist" mit dazu? Macht das aufräumen einfacher und nachhaltiger.
Zweiter Wunsch: Button, um alle Seite eines Host zu aktualisieren, sprich delete + recrawl. Ist einen moderierten Index eine gute Ergänzung.
PCA42
 
Beiträge: 621
Registriert: Mi Jan 23, 2008 4:19 pm
Wohnort: @Home

Re: Hostbrowser: Ergänzende Möglichkeiten

Beitragvon Orbiter » So Nov 18, 2012 1:51 am

das mit der Blackliste verstehe ich, wollte aber vor längerer Zeit schon mal so einen Knopf woanders hin machen und musste feststellen dass die Einrichtung eines Blacklisteintrags ein einziger Schmerz ist. Brr.
Ein Recrawl des Hosts stelle ich mir schon leichter vor, jedoch muss man da zumindest so viel Intelligenz einbauen dass man sieht ob man automatisch '?' akzeptieren an machen muss oder nicht.
Orbiter
 
Beiträge: 5798
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Hostbrowser: Ergänzende Möglichkeiten

Beitragvon PCA42 » So Nov 18, 2012 9:26 am

Recrawl ist da wohl das falsche Wort gewesen, für das ich mich da entschieden habe. Besser wäre ein beschrieben wäre es als erneutes parsen alles bekannten URLs eines Hosts beschrieben.
PCA42
 
Beiträge: 621
Registriert: Mi Jan 23, 2008 4:19 pm
Wohnort: @Home

Re: Hostbrowser: Ergänzende Möglichkeiten

Beitragvon Orbiter » So Nov 18, 2012 11:03 am

die Struktur im HostBrowser wird bei jedem Aufruf neu aus den Daten, die in Solr stehen berechnet. 'Neu Parsen' macht da wenig Sinn, 'Neu Laden' schon eher, was ja dann einem Recrawl gleich kommt. Das macht allerdings aus meiner Sicht schon Sinn, vor allem wenn man weiss dass die Domäne bei einem wide Crawl aufgrund der Crawltiefenbegrenzung nur 'berührt' wurde.
Orbiter
 
Beiträge: 5798
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Hostbrowser: Ergänzende Möglichkeiten

Beitragvon Copro » Di Jan 22, 2013 5:08 am

Da ich die HostBrowser.html gerade auf Deutsch übersetzt habe stellen sich mir noch folgende Fragen.
    Warum landet immer der Host "www." in der Übersicht ?
    Kann man denn einen Host auch komplett im HostBrowser löschen ? (Ich schaffe es nur die Teilpfade oder subpaths zu löschen und somit alle URLs aber nicht den Host selbst)
Copro
 
Beiträge: 207
Registriert: Do Dez 13, 2007 3:37 am

Re: Hostbrowser: Ergänzende Möglichkeiten

Beitragvon ribbon » Do Jan 24, 2013 7:17 pm

ich hätte die bitte, dass man für die Domain einen Hyperlink einfügt, der auf die Domain verweist, so dass in einem neuen Tab die Domain/Webseite angesehen werden kann. bislang gehen nur die yacy verlinkungen auf zur Admin Befehlsoberfläche.
Ich will das ding auch browsen können, bzw eine Hostbrowser webseite auch crawlen können
ribbon
 
Beiträge: 212
Registriert: So Jan 06, 2008 4:23 pm

Re: Hostbrowser: Ergänzende Möglichkeiten

Beitragvon Orbiter » Mo Feb 04, 2013 9:30 pm

ok!

Hab da nun einen Link in die Legende (Titelzeile) eingebaut; wo sollte denn der Link ansonsten hin?

Das mit dem Crawlen ist so eine Sache: wenn man die Sachen im HostBrowser sehen kann, dann hat man sie auch im Index; Das könnte der Grund sein dass ein Crawl fehl schlägt weil das beim Double-Check den Crawl schnell beenden lässt. Man müsste das dann komplett anders machen, z.B. so: "Ganze Domain Löschen und komplett neu erfassen". Dazu wäre es relativ einfach einen Knopf hin zu machen. So ok?
Orbiter
 
Beiträge: 5798
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Hostbrowser: Ergänzende Möglichkeiten

Beitragvon ribbon » So Feb 24, 2013 6:09 pm

habs noch nicht testen können, ziel ist, dass ich meine hostbrowserwebseite abspeichere, und ein anderer die Doamians auf der Webseite als startseite dann crawlen kann, daher müssen die domains des hostbrowsers ins web verlinks sein und nicht zu yacy.
ribbon
 
Beiträge: 212
Registriert: So Jan 06, 2008 4:23 pm


Zurück zu Wunschliste

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste

cron