Institut für Mathematik Universität Augsburg Logo des Instituts für Mathematik

MARC-Compute-Icon

   MARC

   Compute-Fenster

ScreenShot MARC-Compute
ScreenShot eines Compute-Fensters

Nach Auswahl der Daten-Datei im Marc-Fenster wird diese gelesen und die Transaktionen analysiert.
Die Datei wird zweimal gelesen: im ersten Durchgang werden die Kategorien der Variablen und die Anzahl der Transaktionen bestimmt, im zweiten werden die Transaktionen kodiert. Mit diesen Informationen wird die Variablen-Tabelle erstellt, wie Sie sie oben als ScreenShot sehen.

Wie alle MARC-Tabellen können Sie auch diese durch einen Maus-Klick in den Tabellen-Header sortieren (Modifier SHIFT: aufsteigend; CTRL: nach Selektion) oder Sammel-Selektieren (Modifier ALT oder META). Die letztere Funktion ist für die beiden edierbaren Spalten missing und as Y abgewandelt worden (siehe unten).

ScreenShot eines Compute-Fensters mit sortierter Variablen-Tabelle
ScreenShot eines Compute-Fensters mit sortierter Variablen-Tabelle

 

Elemente des Compute-Fensters

Index
Diese Spalte dient der eindeutigen Identifizierung in allen Variablen-Tabellen des gleichen Datensatzes.

Variable
Kategorie
Diese Felder sind Textfelder. Im Beispiel-Datensatz sas.dat (der Name steht im Header des Fensters) gibt es nur die Kategorien "0" und "1", was numerisch aussieht, aber dennoch als Text behandelt wird.

Missing
In der Variablen-Tabelle können Sie durch Klick in das entsprechende Feld dieser Spalte markieren, welche Variablen/Kategorien als Missing Value gelten sollen. Kategorien, die bereits im Marc-Fenster als missing deklariert sind, werden zu Beginn nicht angezeigt; durch Anhaken des show Missings-Flags können Sie auch diese Werte sehen.
ScreenShot eines Compute-Fensters mit Variablen-Tabelle incl. Missings
ScreenShot eines Compute-Fensters mit Variablen-Tabelle incl. Missings

Anmerkung: das Missing-Markieren können Sie nur, wenn das show Missings-Flag aktiviert ist; andernfalls würde jede angeklickte Kategorie sofort aus der Tabelle verschwinden, was recht verblüffend wirkt.
In dieser Spalte verhält sich die Sammel-Selektion (ALT-Klick in den Spalten-Header) anders, nämlich als Wert-Änderung für die selektierten Zeilen. Mit zusätzlichem SHIFT-Modifier werden die Flags der selektierten Zeilen gesetzt, mit zusätzlichem CTRL-Modifier werden sie gelöscht, und ohne zusätzlichen Modifier (oder mit beiden) werden diese Flags umgeschaltet. Die Selektion der Zeilen sollte zuvor in einer anderen (nicht-edierbaren) Spalte vorgenommen werden.
Da -wie erwähnt- ein Editing nur bei aktiviertem show Missings-Flag möglich ist, ist dieses Sammel-Editing auch nur dann aktiv; andernfalls ist das Standard-Verhalten Sammel-Selektion eingeschaltet.

as Y
Bei der Regel-Berechnung werden nur jene Variablen/Kategorien im Folgerungs-Teil zugelassen, deren as Y-Flag gesetzt ist. Dadurch können auch bei geringen Werten für minimum Support oder minimum Confidence in endlicher (Rechen-)Zeit Ergebnisse (wenn auch nur für eine einzelne Variable) gewonnen werden. Diese Spalte ist ebenso wie Missing edierbar, und zwar in gleicher Weise, also auch mit Sammel-Editing (siehe oben). Die Selektion sollte dann zuvor in einer anderen (nicht-edierbaren) Spalte vorgenommen werden.

max rule level
Hier tragen Sie ein, welchen Level die berechneten Regeln maximal haben sollen (0=ohne Limit; absolute Obergrenze ist die Anzahl der Variablen).

max rule count
Hier tragen Sie ein, wieviele Regeln Sie maximal berechnen wollen (0=ohne Limit).
Anmerkung: Regeln werden stets Level-weise berechnet. Wenn zu Beginn der Level-Rechnung weniger Regeln als maximal erwünscht berechnet sind, wird das gesamte nächste Level berechnet - sofern das maximale Regel-Level dies zuläßt.

minimum Support[%]
Die Regeln müssen mindestens diesen Support haben.
Warnung: der Wert sollte strikt positiv sein und maximal 100.0 betragen. Beim Wert 0.0 werden alle Kategorien mit allen Kategorien aller anderen Variablen zu Regeln verbunden, was i.a. sehr viele Regeln ergeben wird und entsprechend lange dauert. Werte über 100.0 sind nicht sinnvoll, da es sich um eine Prozent-Zahl handelt.

minimum Confidence[%]
Die Regeln müssen mindestens diese Konfidenz haben.
Die obige Warnung gilt hier analog.

compute
Dieser Knopf startet das Berechnen der Assoziationsregeln zu den angegebenen Daten und Parametern und erzeugt ein TwoKey-Fenster.


[Uni Augsburg]  [Math.-Nat. Tech. Fakultät]  [Institut für Mathematik]  [Autor]  [E-Mail]  [Print-Version]  aktualisiert am: 23.10.2023;  © Uni Augsburg