Netzwerkrecherche Jahreskonferenz, #nr13

Wo stand was zu YaCy in der Presse?

Netzwerkrecherche Jahreskonferenz, #nr13

Beitragvon Orbiter » Fr Jun 07, 2013 11:07 pm

Diesmal nicht in der Presse, sondern für die Presse!

http://programm.netzwerkrecherche.org/2 ... 36.de.html
Ein YaCy Vortrag für investigative Journalisten im NDR. Das wird spannend. YaCy als zensurresistentes Hacker-Tool, wo Journalisten ohne Angst vor Beobachtungen recherchieren und Daten sammeln können. Apropos Daten sammeln: ich werde eine PirateBox dabei haben und die mit YaCy und dem Thema Journalistische Recherche verbinden...

Aufruf an alle: was könnte einen Journalisten noch so interessieren zum Thema Websuche (auch allgemeiner?), was sollte ich nicht vergessen zu erwähnen, wer hat eine interessante Anwendung für YaCy in diesem Umfeld die wir noch nicht kennen?
Bitte hier posten!!!
Orbiter
 
Beiträge: 5796
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Netzwerkrecherche Jahreskonferenz, #nr13

Beitragvon Hadmut » Fr Jun 07, 2013 11:31 pm

    Plagiate suchen, Ghostwriter finden
    Texte suchen, die durch Sabotage und konzertierte Zensuraktionen aus den Suchmaschinen wie Google geschossen wurden bzw. resistent gegen Suchmaschinensabotage, SEO usw. werden
    Stellen finden, an denen von (scheinbar) verschiedenen Autoren gleiche Formulierungen oder Textstile verwendet wurden
    Texte finden, die von Agenturen oder Bots in Social Media eingestellt wurden
    Änderungsstaffeln aufdecken
    Änderungszeitpunkte feststellen / Alarmieren
    Dauerhafte und stabile Suchindexierung, Beleg-Archivierung
    Suchen, ohne dabei von der US-Regierung überwacht zu werden. ;-)
    Offline-Suchergebnisse
    Personennetzwerke aufdecken
Hadmut
 
Beiträge: 2
Registriert: Fr Jun 07, 2013 11:19 pm

Re: Netzwerkrecherche Jahreskonferenz, #nr13

Beitragvon Orbiter » Sa Jun 08, 2013 11:16 am

Hi Hadmut, super Liste, vielen Dank!
Was an diesen Sachen auffällt, ist die direkte Anwendersicht ohne Rücksicht auf technische Machbarkeit :) aber genau so muss das sein. Jetzt werde ich die Punkte einzeln analysieren und schauen was man wie machen kann.
Orbiter
 
Beiträge: 5796
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Netzwerkrecherche Jahreskonferenz, #nr13

Beitragvon Hadmut » Sa Jun 08, 2013 12:27 pm

> Was an diesen Sachen auffällt, ist die direkte Anwendersicht ohne Rücksicht auf technische Machbarkeit

Ich bin Informatiker und befasse mich mit Webtechnologie und deren Realisierung, seit es sie gibt. Ich schlage nichts vor, dessen „Machbarkeit” ich nicht sehen würde.
Hadmut
 
Beiträge: 2
Registriert: Fr Jun 07, 2013 11:19 pm

Re: Netzwerkrecherche Jahreskonferenz, #nr13

Beitragvon Orbiter » So Jun 09, 2013 12:44 am

Hi Hadmut, war nicht so gemeint, ich muss aber herausfinden was ich konkret vorführen werde um diese Sachen zu zeigen. Ich ordne mal:

Hadmut hat geschrieben:
    Plagiate suchen, Ghostwriter finden
    Stellen finden, an denen von (scheinbar) verschiedenen Autoren gleiche Formulierungen oder Textstile verwendet wurden
    Texte finden, die von Agenturen oder Bots in Social Media eingestellt wurden

Das sind Anwendungen von Textteil-Doubletten Suche mit exact-string-matching plus Automatismen (die wir noch nicht haben...):
- Plagiate: man müsste von einem 'Referenzdokument' aus automatisch gewisse Textfragmente (z.B. Satzteile) identifizieren, und daraus automatisiert Suchanfragen in den Index stellen, mit einer Ergebnisliste die nach Anzahl der Treffer sortiert ausgibt wo man Textteile antrifft. Das könnte interessant werden.
- Verschiedene Autoren mit gleichen Formulierungen: wie bei Plagiate, nur ist das Referenzdokument auch irgendwie unbekannt bzw. Man muss eine größere Menge von möglichen Kandidaten durchgehen und dann eine Statistik machen, wo man viele Plagiate gefunden hat.
- Bots identifizieren: hochinteressant! Aber wie identifiziere ich deren Formulierungen, gibts dazu Beispiele?

Hadmut hat geschrieben:
    Texte suchen, die durch Sabotage und konzertierte Zensuraktionen aus den Suchmaschinen wie Google geschossen wurden bzw. resistent gegen Suchmaschinensabotage, SEO usw. werden

Das ist die Abteilung 'Zensurresistenz'. Man bräuchte mal ein griffiges Beispiel dazu.

Hadmut hat geschrieben:
    Änderungszeitpunkte feststellen / Alarmieren

Das gehört zum Thema Alerts, aber wie ich die Änderungen in Dokumenten feststellen soll weiss ich nicht. Man kann zwar beim Crawlen feststellen dass eine Datei neuer ist, dann wird aber kein Delta zur vorherigen Version erstellt. Alarmieren können wir je nach Suche aber, u.a. mit Hilfe des RSS Search Output Formats in YaCy.

Hadmut hat geschrieben:
    Suchen, ohne dabei von der US-Regierung überwacht zu werden. ;-)

Anonymität: dazu fällt mir ein, dass wir im P2P-Modul in der Suche auch die Option haben, temporär nicht per P2P zu suchen. Dann gehen auch keine Suchanfragen an die anderen Peers. Das könnte man einfach 'stealth-modus' nennen und stärker hervorheben.

Hadmut hat geschrieben:
    Dauerhafte und stabile Suchindexierung, Beleg-Archivierung
    Offline-Suchergebnisse

was ist eine 'stabile' Suchindexierung? Beleg-Archivierung ist gute Idee; Offline-Suchergebnisse fällt technisch gesehen mit dem oben erwähnten 'stealth-Modus' zusammen, ist aber eine andere Betrachtungsweise.

Hadmut hat geschrieben:
    Personennetzwerke aufdecken
    Änderungsstaffeln aufdecken

Hier habe ich keine Entsprechung zu etwas, was wir machen können, gefunden. Wie deckt man ein Personennetzwerk auf, woran erkennt man das?
Was ist eine Änderungsstaffel?
Orbiter
 
Beiträge: 5796
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Netzwerkrecherche Jahreskonferenz, #nr13

Beitragvon Orbiter » Mi Jun 12, 2013 2:13 pm

hab es tatsächlich noch geschafft eine automatische Plagiat-Suche einzubauen!
Wenn alles klappt kommts morgen in Release 1.5
Orbiter
 
Beiträge: 5796
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Netzwerkrecherche Jahreskonferenz, #nr13

Beitragvon Orbiter » Mi Jun 26, 2013 10:03 pm

Orbiter
 
Beiträge: 5796
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main


Zurück zu Presse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast