Google News durch YaCy News ersetzen

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

Google News durch YaCy News ersetzen

Beitragvon ribbon » So Jan 17, 2010 4:48 pm

Idee ist, mit YaCy nicht nur web, bilder, audio zu suchen, sondern auch einen Radio-Button für News zu haben.

Dann sollten in der Suche nur Seiten zu einem Stichwort erscheinen, die

a) nicht älter als 4 Wochen sind,
b) aus dem Feeworld Netz kommen,
c) von einer White-Liste and definierten Domains kommen (pro Land definiert, zentral in YaCy bei Installation definiert, der User kann erweitern).

Dann würde man in Freeworld nach Webseiten suchen, die ein bestimmtes Suchwort haben, aber nicht älter als 4 Wochen sind und zudem nur von Domains kommen, die auf einer Whiteliste stehen.

Dazu müsste man dann je nach Landessprache, in der YaCy eingestellt ist, eine Liste pflegen und bei der Installation installieren lassen, die Domains von New-Portalen enthält, wie http://www.spiegel.de, http://www.hamburger-morgenpost.de, http://www.hintersdortfer-kleinbote.de, http://www.stadtspiegel-hueckelshoven.de usw.

In einem Wiki können die USer weitere News-Domain vorschläge machen, weltweit, die dann in die Installation mit aufgenommen werden. Der User kann in seinem Node auch Urls ergänzen.

Kann man so eine Whiteliste definieren und das dann in das Suchefeld mit einbauen, dass es auch eine Newssuche gibt?

wie hier: http://de.driggle.com/news


??
ribbon
 
Beiträge: 212
Registriert: So Jan 06, 2008 4:23 pm

Re: Google News durch YaCy News ersetzen

Beitragvon ribbon » So Mai 09, 2010 6:23 pm

? kann man das nicht mit einer domainliste machen?
http://www.humanitas-international.org/ ... -sites.htm
ribbon
 
Beiträge: 212
Registriert: So Jan 06, 2008 4:23 pm

Re: Google News durch YaCy News ersetzen

Beitragvon ribbon » Mo Mai 17, 2010 8:20 pm

http://www.scouty.de/index.html?q=yacy

geht das nicht auch in yacy?
ribbon
 
Beiträge: 212
Registriert: So Jan 06, 2008 4:23 pm

Re: Google News durch YaCy News ersetzen

Beitragvon dulcedo » Mo Mai 17, 2010 9:09 pm

Man kann einen robinson-peer, oder ein ganzes Netz nutzen und seine crawls auf solche Quellen beschränken. Bei der Abfrage nach news diesen gezielt abfragen, die per XML gelieferten Ergebnisse muss dann eben die entsprechende Anwendung darstellen.
Eine automatische Erkennung solcher Inhalte halte ich für sehr schwer, wenn möglich dann schon beim crawl.
dulcedo
 
Beiträge: 1006
Registriert: Do Okt 16, 2008 6:36 pm
Wohnort: Bei Karlsruhe

Re: Google News durch YaCy News ersetzen

Beitragvon ribbon » Mo Mai 17, 2010 10:46 pm

es muss doch möglich sein, freeworld abzufragen und die ergebnisse zu filtern nur nach den beiden domains
http://www.spiegel.de und http://www.weser-kurier.de

oder?

und man kann doch die filterliste beliebig lang machen, so dass auch http://www.newspost.southafrika.com dabei ist???
warum sollte man das nicht filtern können bzw gezielt danach suchen?

wenn nicht, kann man es einfach einrichten? Wenn nicht, macht es sinn, einen peer aufzusetzen, der nur 10 domains abfragt?
muss das ein Robinson peer sein oder geht es auch im freeworld, dass ich nur urls von anderen akzepierem, die vom http://www.spiegel.de und http://www.weserkuier.de sind?

warum gibt es in yaxy keine Whitelist Funktion?
ribbon
 
Beiträge: 212
Registriert: So Jan 06, 2008 4:23 pm

Re: Google News durch YaCy News ersetzen

Beitragvon Low012 » Di Mai 18, 2010 1:20 am

Man kann die Suchergebnisse mit der URL-Mask einschränken ("more options" auf der Suchseite): http://www\.(spiegel|weser-kurier)\.de/.*

Außerdem können mit dem Schlüsselwort RECENT neue Dokumente bevorzugt werden.

Als URL könnte das z.B. so aussehen: http://4o4.dyndns.org:8080/yacysearch.html?query=fu%C3%9Fball&Enter=search+again&contentdom=text&former=fu%C3%9Fball&maximumRecords=10&startRecord=0&verify=true&resource=global&nav=all&urlmaskfilter=http%3A%2F%2Fwww%5C.%28spiegel%7Cweser-kurier%29%5C.de%2F.%2A&prefermaskfilter=&depth=0&cat=href&display=2&constraint=&meanCount=0
Low012
 
Beiträge: 2214
Registriert: Mi Jun 27, 2007 12:11 pm

Re: Google News durch YaCy News ersetzen

Beitragvon dulcedo » Di Mai 18, 2010 4:30 am

Eine Auswahl internationaler online-Presse umfasst bei mit 500 domains. Wenn natürlich nur eine Handvoll davon gefunden werden soll ist die Filterlösung einfacher.
dulcedo
 
Beiträge: 1006
Registriert: Do Okt 16, 2008 6:36 pm
Wohnort: Bei Karlsruhe

Re: Google News durch YaCy News ersetzen

Beitragvon ribbon » Di Mai 18, 2010 7:57 am

ja die url sieht doch super aus, nur leider ist das aktuelle ergebnis nicht on top.
der 7, Mai ist vor dem 13 Mai, kann man die Ergebnisse auch dementsprechend nach datum sortieren?

wie müsste man die Url mask ändern, wenn der Weserkurier die domain .com hätte?

Was heisst Filterlösung? ist das eine weitere Methode neben der url? müsste die implementiert werden oder gibt es die schon?
und in der tat hätte man ja 500 Zeitungen, die URL würde ganz schön lang, kann man das also nicht über eine Whitelist für Zeitungen machen?

Aber die Url ist schon ganz nett, nur nach Datum müsste es sortiert werden...
ribbon
 
Beiträge: 212
Registriert: So Jan 06, 2008 4:23 pm

Re: Google News durch YaCy News ersetzen

Beitragvon Lotus » So Mai 23, 2010 8:35 pm

ribbon hat geschrieben:Aber die Url ist schon ganz nett, nur nach Datum müsste es sortiert werden...

Im Ranking gibt es unter anderem eine Einstellung "Date".
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: Google News durch YaCy News ersetzen

Beitragvon Orbiter » Mo Mai 24, 2010 8:31 am

ja im ranking date ganz nach oben stellen und alle andere rankings mindestens 6 punkte kleiner, sonst wirkt das nicht.
oder bei der suche einfach das wort RECENT in großbuchstaben hinzufügen, das beeinflusst ebenfalls das ranking nach datum
Orbiter
 
Beiträge: 5792
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Google News durch YaCy News ersetzen

Beitragvon ribbon » Mo Mai 24, 2010 9:53 pm

danke, probiere es mal, dass es in den rankingeinstellungen sowas geben müsste, hatte ich mir gedacht,
kann man es denn nicht als default machen und dann einen urlfilter über eine datei reinziehen, wobei die datei von irgendwo default geladen wird?
dann hat man doch noch einen radiobutton mit dem stichwort news, das das aktuellste datum on top sortiert, aber von allen peers.
ribbon
 
Beiträge: 212
Registriert: So Jan 06, 2008 4:23 pm

Re: Google News durch YaCy News ersetzen

Beitragvon Orbiter » Mo Mai 24, 2010 10:59 pm

Die Sortierreihenfolge zu einem Navigator zu machen ist ok und hatte ich schon angedacht, nur war es noch nicht dran..
Orbiter
 
Beiträge: 5792
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Google News durch YaCy News ersetzen

Beitragvon ribbon » Di Mai 25, 2010 6:38 pm

was ist ein Navigator? der Radiobutton? oder die Zieharmonika an der Seite?
und kann man die Such dann nicht auf einen in einer Datei definierten URL Domain Filter beziehen, sprich nur Domains von Newsportalen?
ich meine, wenn es dran ist?
ribbon
 
Beiträge: 212
Registriert: So Jan 06, 2008 4:23 pm

Re: Google News durch YaCy News ersetzen

Beitragvon Low012 » Mi Mai 26, 2010 9:57 am

ribbon hat geschrieben:was ist ein Navigator? der Radiobutton? oder die Zieharmonika an der Seite?

Die Ziehharmonika an der Seite!
Low012
 
Beiträge: 2214
Registriert: Mi Jun 27, 2007 12:11 pm


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 5 Gäste