WWW.ABSTRACT.XLIBX.INFO
FREE ELECTRONIC LIBRARY - Abstract, dissertation, book
 
<< HOME
CONTACTS



Pages:   || 2 | 3 | 4 | 5 |   ...   | 8 |

«IBM SPSS Modeler Entity Analytics 15-Benutzerhandbuch Hinweis: Lesen Sie zunächst die allgemeinen Informationen unter Hinweise auf S. 67, bevor Sie ...»

-- [ Page 1 ] --

IBM SPSS Modeler Entity Analytics

15-Benutzerhandbuch

Hinweis: Lesen Sie zunächst die allgemeinen Informationen unter Hinweise auf S. 67, bevor Sie

dieses Informationsmaterial sowie das zugehörige Produkt verwenden.

Diese Ausgabe bezieht sich auf und alle nachfolgenden Versionen sowie Anpassungen, sofern

dies in neuen Ausgaben nicht anders angegeben ist.

Screenshots von Adobe-Produkten werden mit Genehmigung von Adobe Systems Incorporated

abgedruckt.

Screenshots von Microsoft-Produkten werden mit Genehmigung der Microsoft Corporation abgedruckt.

Lizenziertes Material - Eigentum von IBM Eingeschränkte Rechte für Benutzer der US-Regierung: Verwendung, Vervielfältigung und Veröffentlichung eingeschränkt durch GSA ADP Schedule Contract mit der IBM Corp.

Vorwort IBM® SPSS® Modeler ist die auf Unternehmensebene einsetzbare Data-Mining-Workbench von IBM Corp.. Mit SPSS Modeler können Unternehmen und Organisationen die Beziehungen zu ihren Kunden bzw. zu den Bürgern durch ein tief greifendes Verständnis der Daten verbessern.

Organisationen benutzen die mithilfe von SPSS Modeler gewonnenen Erkenntnisse zur Bindung profitabler Kunden, zur Ermittlung von Cross-Selling-Möglichkeiten, zur Gewinnung neuer Kunden, zur Ermittlung von Betrugsfällen, zur Reduzierung von Risiken und zur Verbesserung der Verfügbarkeit öffentlicher Dienstleistungen.

Die visuelle Benutzeroberfläche von SPSS Modeler erleichtert die Anwendung des spezifischen Geschäftswissens der Benutzer, was zu leistungsstärkeren Vorhersagemodellen führt und die Zeit bis zur Lösungserstellung verkürzt. SPSS Modeler bietet zahlreiche Modellierungsverfahren, beispielsweise Algorithmen für Vorhersage, Klassifizierung, Segmentierung und Assoziationserkennung. Nach der Modellerstellung ermöglicht IBM® SPSS® Modeler Solution Publisher die unternehmensweite Bereitstellung für Entscheidungsträger oder in einer Datenbank.

Über IBM Business Analytics IBM Business Analytics-Software bietet vollständige, einheitliche und genaue Informationen, auf die Entscheidungsträger vertrauen, um die Unternehmensleistung zu steigern. Ein umfassendes Portfolio von Anwendungen für Unternehmensinformationen, Vorhersageanalysen, Verwaltung der Finanzleistung und Strategie sowie Analysen bietet sofort klare und umsetzbare Einblicke in die aktuelle Leistung und ermöglicht die Vorhersage zukünftiger Ergebnisse. In Kombination mit umfassenden Branchenlösungen, bewährten Vorgehensweisen und professionellen Dienstleistungen können Unternehmen jeder Größe optimale Produktivität erreichen, die Entscheidungsfindung zuverlässig automatisieren und bessere Ergebnisse erzielen.

Als Teil dieses Portfolios unterstützt die IBM SPSS Predictive Analytics-Software Unternehmen dabei, zukünftige Ereignisse vorherzusagen und aktiv auf diese Erkenntnisse zu reagieren, um bessere Geschäftsergebnisse zu erzielen. Kunden aus den Bereichen Wirtschaft, Behörden und Bildung aus aller Welt verlassen sich auf die IBM SPSS-Technologie. Sie bringt Ihnen beim Gewinnen, Halten und Ausbauen neuer Kundenbeziehungen einen Wettbewerbsvorteil und verringert gleichzeitig das Betrugs- sowie andere Risiken. Durch Integration der IBM SPSS-Software in den täglichen Betrieb können diese Unternehmen qualifizierte Vorhersagen treffen und dadurch die Entscheidungsfindung so ausrichten und automatisieren, dass Geschäftsziele erreicht werden und ein messbarer Wettbewerbsvorteil entsteht. Wenn Sie weitere Informationen wünschen oder einen Mitarbeiter kontaktieren möchten, ist dies unter http://www.ibm.com/spss möglich.

Technischer Support Kunden mit Wartungsvertrag können den technischen Support in Anspruch nehmen. Kunden können sich an den technischen Support wenden, wenn sie Hilfe bei der Arbeit mit IBM Corp.-Produkten oder bei der Installation in einer der unterstützten Hardware-Umgebungen benötigen. Die Kontaktdaten des Technischen Supports finden Sie auf der IBM Corp.-Website iii unter http://www.ibm.com/support. Sie müssen bei der Kontaktaufnahme Ihren Namen, Ihre Organisation und Ihre Supportvereinbarung angeben.

–  –  –

vi Kapitel Entitätsanalyse Informationen zur Entitätsanalyse IBM® SPSS® Modeler Entity Analytics fügt eine völlig neue Dimension zu den IBM® SPSS® Modeler-Vorhersageanalysen hinzu. Während bei Vorhersageanalysen versucht wird, zukünftiges Verhalten aus früheren Daten vorherzusagen, liegt der Schwerpunkt bei der Entitätsanalyse auf der Verbesserung von Kohärenz und Konsistenz der aktuellen Daten, indem Identitätskonflikte innerhalb der Datensätze selbst aufgelöst werden. Bei der Identität kann es sich um die Identität einer Person, einer Organisation, eines Objekts oder einer anderen Entität handelt, bei der Unklarheiten bestehen könnten. Die Identitätsauflösung kann in einer Reihe von Bereichen entscheidend sein, darunter Customer Relationship Management, Betrugserkennung, Bekämpfung der Geldwäsche sowie nationale und internationale Sicherheit.

Angenommen, Sie besitzen die folgenden Kundendatensätze aus zwei verschiedenen Quellen und sind sich nicht sicher, ob sie sich auf dieselbe Person oder auf zwei verschiedene Personen beziehen.

–  –  –

Es gibt keine genauen Übereinstimmungen in den Daten zwischen den beiden Datensätzen. Wenn wir jedoch noch eine dritte Quelle hinzunehmen, finden wir gemeinsame Attribute.





–  –  –

Die Führerscheinnummer verknüpft die Datensätze in Quelle 1 und Quelle 3 und die Telefonnummer verknüpft die Quellen 2 und 3. Wir können also hinreichend sicher sein, dass sich alle drei Quellen auf dieselbe Person beziehen.

Aber was tun wir, wenn der Sachverhalt weniger klar ist? Möglicherweise haben wir nur sehr wenige Daten, die wir unserer Entscheidung zugrunde legen können. Betrachten Sie die beiden folgenden Datensätze.

–  –  –

Offensichtlich ist dies nicht der Herr Schmidt aus den vorangegangenen Datensätzen: die Unterschiede sind groß genug, dass wir dies ausschließen können. Wir haben jedoch trotzdem ein Problem. Zwei verschiedene Datensätze aus derselben Datenquelle scheinen sich auf dieselbe Person zu beziehen. Handelt es sich um doppelte Datensätze? Wir können nicht sicher sein, solange wir keinen anderen zugehörigen Datensatz finden, der uns weitere Informationen liefert, möglicherweise einen Datensatz aus einer anderen Quelle.

–  –  –

Dies löst das Problem. Bei den beiden Datensätzen in Quelle 4 handelt es sich nicht um Duplikate, sondern tatsächlich um einen Vater und einen Sohn mit demselben Namen und unter derselben Adresse, die dieselbe Telefonnummer verwenden. Bei einem manuellen System könnte eine wochenlange Suche erforderlich sein, um den einen Datensatz zu finden, der die Identitäten auflöst. Mit einem automatisierten Entitätsanalysesystem wird der Zeitaufwand für die Auflösung erheblich reduziert.

Entitätsanalyse

Entitätsanalyse und Vorhersageanalyse Wenn alle Ihre Daten aus einer einzigen, vollständigen und unzweideutigen Datenquelle bestehen würden, wäre es für IBM® SPSS® Modeler relativ einfach, etwaige Identitätskonflikte aufzulösen. Sie bräuchten lediglich die Vorhersageanalyse, um Ihre Daten in SPSS Modeler einzulesen, die Verarbeitung durchzuführen und zuverlässige Ergebnisse zu erhalten.

In der realen Welt sieht die Sache jedoch normalerweise deutlich anders aus. Die Daten sind typischerweise alles andere als vollständig, häufig mehrdeutig und oftmals über viele verschiedene Datenquellen verstreut, in denen viele verschiedene Attribute mit wenigen sich überlappenden Feldern dokumentiert sind. Der Nutzen der Entitätsanalyse liegt zum Teil darin, dass Daten aus all den verschiedenen Quellen in einem einzigen, zentralen Bereich, dem so genannten Repository, gesammelt werden. Das Entitätsanalysesystem untersucht die Daten dann bis ins kleinste Detail, um Konflikte aufzulösen. Dabei erhalten Datensätze, die von derselben Person oder Organisation stammen, eine eindeutige ID.

–  –  –

Sie benötigen nun Kenntnisse darüber, wie SPSS Modeler funktioniert. SPSS Modeler ist ein sehr benutzerfreundliches Tool, das auf der grafischen Darstellung eines Datenstreams beruht, der eine Reihe von Knoten durchläuft. Jeder Knoten steht für einen bestimmten Schritt des Arbeitsablaufs.

SPSS Modeler selbst enthält eine große Palette an Knoten, die alle standardmäßigen Data Mining-Funktionen abdecken. IBM SPSS Modeler Entity Analytics fügt Knoten speziell für die Verwendung in Entitätsanalysen hinzu. Hierbei handelt es sich um den EA-Exportknoten, den Entity Analytics-(EA-)Quellenknoten und den Prozessknoten “Streaming von EA”.

Der Prozess wird durch die folgende Abbildung dargestellt.

–  –  –

Schritt 1: Datenquelle in SPSS Modeler einlesen Ihre erste Aufgabe besteht darin, Ihre Daten mithilfe eines Quellenknotens in SPSS Modeler einzulesen. Quellenknoten werden in SPSS Modeler durch ein rundes Symbol gekennzeichnet.

Abbildung 2-2 IBM SPSS Modeler-Quellenknoten Die Daten können in jedem beliebigen Format vorliegen, das von SPSS Modeler unterstützt wird, beispielsweise Textdateien, Datenbanktabellen, Kalkulationstabellen, XML-Dateien usw. Für jedes verschiedene Format ist jedoch jeweils ein entsprechender SPSS Modeler-Quellenknoten erforderlich. In der Abbildung handelt es sich um einen Datenbank-Quellenknoten.

Jede Datenquellendatei benötigt ein Feld, das die einzelnen Datensätze eindeutig kennzeichnet.

Wenn eine Datenquelle kein derartiges Feld aufweist, können Sie problemlos eines in SPSS Modeler hinzufügen. Für weitere Informationen siehe Thema Hinzufügen einer eindeutigen Datensatz-ID in Kapitel 3 auf S. 15.

Für weitere Informationen siehe Thema Verbindung mit einer Datenquelle in Kapitel 3 auf S. 15.

Kapitel 2 Schritt 2: Repository erstellen Der Schwerpunkt all Ihrer Bemühungen im Bereich der Entitätsanalyse liegt auf dem Repository, dem zentralen Speicherbereich, in dem Sie alle Datensätze sammeln können.

Zur Erstellung eines Repositorys verbinden Sie zunächst die Datenquelle mit einem EA-Exportknoten, der durch das quadratische Symbol repräsentiert wird.

Abbildung 2-3 Verbinden mit einem Repository

–  –  –

Der Vorgang der Repository-Erstellung wird weiter unten ausführlich beschrieben. Für weitere Informationen siehe Thema Einrichten eines Entitäts-Repositorys (EA-Exportknotens) in Kapitel 3 auf S. 14.

Nachdem Sie ein Repository eingerichtet haben, können Sie seine Inhalte auf verschiedene Weisen verwalten. Für weitere Informationen siehe Thema Konfigurieren eines Entitäts-Repository in Kapitel 3 auf S. 23.

Schritt 3: SPSS Modeler mit dem Repository verbinden Nach der Erstellung des Repositorys müssen Sie es nun mit dem SPSS Modeler-Stream verbinden.

Abbildung 2-5 Verbinden mit dem Repository Für weitere Informationen siehe Thema Optionen für das Entitäts-Repository in Kapitel 3 auf S. 18.

Schritt 4: Eingabefelder den Repository-Merkmalen zuordnen Datenquellen können mehrere Arten von Entitätsinformationen enthalten. Einige Informationstypen kommen bei den meisten Entitätsdatenquellen vor, während andere möglicherweise nur bei einer bestimmten Datenquelle vorkommen. Bei einem Entitäts-Repository werden diese verschiedenen Informationstypen als Merkmale bezeichnet. Das Repository stellt eine Reihe von Merkmalen als Standard bereit, und Sie können auch eigene Merkmale erstellen.

Ein Repository-Merkmal ist ein einzelner Informationstyp, der zusammen mit einer Entitätsdatenquelle verwendet werden kann. Einige Merkmale (z. B. Vorname, Nachname, Geburtsdatum usw.) können mit vielen verschiedenen Datenquellen verwendet werden, während andere Merkmale nur bei einer bestimmten Datenquelle vorkommen. Ein Merkmal entspricht üblicherweise einem Feld in einem Datensatz oder einer Spalte in einer Datenbanktabelle.

Kapitel 2

Wenn Sie ein Repository erstellt und eine Verbindung damit hergestellt haben, kennzeichnen Sie ein Feld Ihrer Eingabedaten als Feld mit dem eindeutigen Schlüssel, das in der nachfolgenden Analyse verwendet wird. Außerdem ordnen Sie die Eingabedatenfeldern den entsprechenden Merkmalen im Repository zu. Damit sollen Dopplungen im Repository vermieden werden, für den Fall, dass verschiedene Datenquellen unterschiedliche Namen für Felder verwenden, die dieselbe Art von Informationen enthalten. Der EA-Exportknoten enthält eine Zuordnungstabelle, in der Sie die Zuordnungen erstellen können.

Abbildung 2-6 Erstellen einer Zuordnung zwischen Eingabefeldern und Merkmalen Für weitere Informationen siehe Thema Erstellen einer Zuordnung zwischen Eingabefeldern und Merkmalen (EA-Exportknoten) in Kapitel 3 auf S. 19.

–  –  –

Schritt 5: Daten in das Repository exportieren und Konflikte auflösen Für die einzelnen Datenquellen ist jeweils ein eigener EA-Exportknoten erforderlich, wenn Ihre Daten also über mehrere verschiedene Quellen verstreut sind, sieht Ihr Stream wohl in etwa wie folgt aus.

Abbildung 2-7 Exportieren von Daten aus mehreren Datenquellen in das Repository Wenn Sie über mehrere Datenquellen verfügen, können Sie auswählen, ob die Datensätze aus einer, einigen oder allen Datenquellen eingelesen werden sollen. Das Entitätsanalysesystem analysiert die von Ihnen ausgewählten Datensätze und fügt zu jedem ein ID-Feld mit der Bezeichnung “$EA_ID” hinzu. Wenn nun zwei oder mehr Datensätze, die sich auf zuvor mehrdeutige Identitäten bezogen, aufgelöst werden können, sind die zu diesen Datensätzen hinzugefügten IDs im gesamten Repository eindeutig. Das System fügt auch ein Feld hinzu, das die Datenquelle angibt, aus der der Datensatz stammt.

Sie verbinden die einzelnen Datenquellenknoten jeweils mit ihrem eigenen EA-Exportknoten, ordnen die Eingabefelder den Repository-Funktionen zu und führen dann den Stream aus, um die Daten aus SPSS Modeler in das Repository zu exportieren und etwaige Identitätskonflikte in einem einzigen Vorgang aufzulösen. Stellen Sie sich zur Veranschaulichung der Funktionsweise vor, dass Sie die folgenden Datensätze in vier verschiedenen Datenquellen besitzen.

–  –  –



Pages:   || 2 | 3 | 4 | 5 |   ...   | 8 |


Similar works:

«15.05.2012 Gericht Asylgerichtshof Entscheidungsdatum 15.05.2012 Geschäftszahl E2 316917-2/2012 Spruch E2 316.917-2/2012-10E IM NAMEN DER REPUBLIK Der Asylgerichtshof hat durch den Richter Mag. HUBER-HUBER als Vorsitzende und die Richterin Dr. FAHRNER als Beisitzer über die Beschwerde des XXXX, StA. Iran, gegen den Bescheid des Bundesasylamtes vom 17.02.2012, FZ. 07 08.577-BAE, nach Durchführung einer mündlichen Verhandlung am 25.04.2012 zu Recht erkannt: Der Beschwerde wird stattgegeben...»

«United States Court of Appeals For the Eighth Circuit _ No. 13-2362 _ Ben Purscell lllllllllllllllllllll Plaintiff Appellant v. Tico Insurance Co.; Infinity Assurance Insurance, Company lllllllllllllllllllll Defendants Appellees Appeal from United States District Court for the Western District of Missouri Jefferson City Submitted: November 12, 2014 Filed: June 22, 2015 Before BYE, SHEPHERD, and KELLY, Circuit Judges. BYE, Circuit Judge. Ben Purscell sued his motor vehicle liability carrier,...»

«Diss. ETH No. 17283 Control of Rotor Tip Leakage and Secondary Flow by Casing Air Injection in Unshrouded Axial Turbines A dissertation submitted to the SWISS FEDERAL INSTITUTE OF TECHNOLOGY ZURICH (ETH Zürich) for the degree of Doctor of Sciences presented by THOMAS BEHR Dipl.-Ing., Dresden University of Technology, Germany born January 14, 1978 citizen of the Federal Republic of Germany accepted on the recommendation of Prof. Dr. Reza S. Abhari, examiner Dr. Erik Janke, co-examiner Dr....»

«Since 1999 ISSN 2226-7425 The journal of scientific articles “Health & education millennium”, 2014, tom 16 № 3 Zdorov'e i obrazovanie v XXI veke Журнал научных статей SOMVOZ TM p-ISSN 2226-7425 e-ISSN 2226-7417 Since 1999 www.clinical-journal.com 2014, VOLUME 16, No 3 ~i~ Издание зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и...»

«COMMITTEE FOR EUROPE, THE MIDDLE EAST AND AFRICA (CEMA) Announcing the 2016 CIS Africa Tour Africa Tour Highlights 11 Destinations: Johannesburg (SOUTH AFRICA), Gaborone (BOTSWANA), Harare (ZIMBABWE), Maputo (MOZAMBIQUE), Nairobi (KENYA), Zanzibar and Dar Es Salaam (TANZANIA), Addis Ababa (ETHIOPIA), Kigali (RWANDA), Accra (GHANA), Lagos (NIGERIA) The tour is scheduled to begin in Johannesburg, South Africa on 23 October. Tour participants will meet in Johannesburg for an orientation before...»

«ROCZNIKI HUMANISTYCZNE Tom LXI, zeszyt 5 – 2013 GRZEGORZ MAZIARCZYK * FROM METAREFERENCE TO STORYTELLING: MULTIMODALITY IN CONTEMPORARY AMERICAN FICTION* A b s t r a c t. The aim of this paper is to discuss the use of multimodality, that is simultaneous employment of verbal and non-verbal semiotic resources, in American fiction from the postmodern novel of the 1960s to the recent examples of novels that depart from the conventional, purely verbal format. In William H. Gass’s Willie...»

«IV. BOOKS, ARTICLES AND ESSAYS, DISSERTATIONS O., S.: Etuda o F. M. Dostojevskom. In: Katolicke noviny 107, 6 (1992): 10. O Dostoevskom: Sbornik statei. A. L. Bem, ed. Paris: AMGA Editions, 1986. 258p. [Articles publiés à Prague en 1929 et 1933 par le Séminaire d'étude de l'oeuvre de Dostoïevski.] O Dostoevskom. Tvorchestvo Dostoevskogo v russkoi mysli, 1881-1931 gg.: Sbornik statei. V. M. Borisov and A. B. Roginskii, comps. Moskva: Kniga, 1990. 429p. O sozdanii Obshchestva Dostoevskogo v...»

«130 Tompkins County Gravestones, [April TOMPKINS COUNTY GRAVESTONE INSCRIPTIONS. Contributed by Mrs. Dora Pope Worden, Corresponding Member of the New York Genealogical and Biographical Society. INTRODUCTION T h e compiling of the following records, which for the most part were gathered in the s u m m e r months during the pastfiveyears, has been for m e a most pleasant and interesting task. Accompanied by s o m e friend, I drove leisurely through this beautiful region. M a n y were the...»

«ka mate ka ora: a new zealand journal of poetry and poetics Issue 11 March 2012 THE GOLD LEAF FROM PETELIA Ted Jenner Acknowledgements are due to the British Museum for the photograph (much enlarged) of the Petelia leaf. As the engraver was running out of space, the last and fourteenth line of text actually appears vertically in the righthand margin. Translation: You will find a spring on your left in Hades’ halls and by it the cypress with its luminous sheen. Do not go near this spring or...»

«CAMFIELD AMETHYST EXPLORATION YEAR 6 Annual Report EXPLORATION LICENCE 10416 For the period: 13 June 2011 to 12 June 2012 Tenement Holder: Barry Kayes Prepared by: Barry Kayes June 2012 CONTENTS Page No.1.0 INTRODUCTION 1.1 3 Location and Access 1.2 3 Tenure 2.0 GEOLOGY Regional Setting 2.1 Local Geology 2.2 PREVIOUS EXPLORATION 3.0 EXPLORATION 4.0 General Prospecting and Marketing 4.1 4.2 Future Exploration SUMMARY 5.0 Blocks relinquished/retained EL10416. Attachment #1 INTRODUCTION This...»

«May 20, 2013 Final Independent External Peer Review Report Willamette River Floodplain Restoration Study, Lower Coast and Middle Forks Subbasins, Oregon Prepared by Battelle Memorial Institute Prepared for Department of the Army U.S. Army Corps of Engineers Ecosystem Restoration Planning Center of Expertise for the St. Paul District Contract No. W912HQ-10-D-0002 Task Order: 0037 Willamette River IEPR Final IEPR Report Final Independent External Peer Review Report Willamette River Floodplain...»

«Writing@CSU Writing Guide Curriculum Vitae This Writing Guide was downloaded from the Writing@CSU Web Site at Colorado State University on May 12, 2016 at 6:32 PM. You can view the guide at http://writing.colostate.edu/guides/guide.cfm?guideid=62. Copyright information and a citation can be found at the end of this document. Main Page What is a Curriculum Vitae? Curriculum Vitae (Latin): the course of your academic life. A Curriculum Vitae (CV) is a formally presented, detailed synopsis of your...»





 
<<  HOME   |    CONTACTS
2016 www.abstract.xlibx.info - Free e-library - Abstract, dissertation, book

Materials of this site are available for review, all rights belong to their respective owners.
If you do not agree with the fact that your material is placed on this site, please, email us, we will within 1-2 business days delete him.