0

Mining Wikipedia

Clustering von Web-Dokumenten mit Self-Organizing Maps

Erschienen am 09.07.2012, 1. Auflage 2012
49,00 €
(inkl. MwSt.)

Lieferbar innerhalb 1 - 2 Wochen

In den Warenkorb
Bibliografische Daten
ISBN/EAN: 9783639436570
Sprache: Deutsch
Umfang: 88 S.
Format (T/L/B): 0.6 x 22 x 15 cm
Einband: kartoniertes Buch

Beschreibung

Inhaltlich unveränderte Neuauflage. In dieser Arbeit wird das SOM-SDn Verfahren (Self-Organizing Map for Structured Data in Networks) vorgestellt. Dieses Verfahren ermöglicht die Clusterung von in einer Netzwerkstruktur vorliegenden Daten mit einer SOM. Der Algorithmus erweitert den im SOM-SD-Verfahren vorgestellten Ansatz eines Kontextvektors zu einer Kontextmenge und beseitigt damit die Einschränkung von SOM-SD, dass die Daten zum Training in einer Baumstruktur vorliegen müssen. Anhand von Experimenten mit künstlich erzeugten Daten wird gezeigt, dass durch das SOM-SDn-Verfahren strukturierte Daten geclustert werden können, die ohne Berücksichtigung des Kontextes nicht oder nur schlechter zu unterscheiden sind. Hierzu wird auf die Wahl der optimalen Parameter eingegangen und beschrieben, wie die Ergebnisse durch eine U-Matrix oder die Extraktion von Links untersucht werden können. Weiterhin wird mit dem Verfahren ein Ausschnitt aus Wikipedia geclustert und die Tauglichkeit des Verfahrens mit realen Daten untersucht. Dieses Buch richtet sich an Interessierte im Bereich Knowledge Discovery und Data Mining.

Autorenportrait

Diplom Informationswirt:Studium an der Universität Karlsruhe und der Massey University (Palmerston North, Neuseeland).