Institut für Mathematik Universität Augsburg Logo des Instituts für Mathematik

MARC-Icon

   MARC

   Datei-Selektion

ScreenShot Marc-Fenster zur Datei-Selektion
ScreenShot des Marc-Fensters zur Datei-Selektion

Nach dem Starten des Programms erscheint das Marc-Fenster zur Auswahl der Daten-Datei (siehe oben). Zunächst wird hier das Daten-Format behandelt, da es die Eingabe-Felder erklärt.

 

Daten-Format

Die Daten werden als Matrix erwartet. Jede Zeile besteht aus gleich vielen <TAB>ulator-getrennten Zellen und wird mit einem Zeilenende-Zeichen (System-abhängig, z.B. <CR>) abgeschlossen.
Die erste Zeile darf eine Beschreibung der Variablen enthalten; dies muss durch das Flag variable line im Marc-Fenster deklariert werden.
Die erste Spalte jeder Zeile darf eine Transaktions-ID enthalten; dies muss durch das Flag ID column im Marc-Fenster deklariert werden. Falls eine Variablen-Zeile vorhanden ist, muss auch diese eine ID-Zelle beinhalten!

 

Numerische Daten

gibt es nicht in MARC! Alle Daten werden als Text behandelt, auch wenn sie numerisch aussehen. Fliesskomma-Zahlen sind zwar möglich, werden aber ebenfalls als Text behandelt; die Werte 1, 1.0 und 1.00 sind daher drei verschiedene Kategorien. Wenn eine Variable 'echte' numerische Werte enthält (nicht nur die anonymisierte Darstellung von Text-Kategorien), sollte der Datensatz zuvor bearbeitet werden; die Liste zur Auswahl der Variablen und Kategorien wird sonst etwa genauso lang wie der Datensatz Transaktionen (=Zeilen) hat.

 

Eingabe-Felder

data file
Hier geben Sie den Namen der Datei an, die ihre zu analysierenden Daten enthält. Ein Datei-Selektions-Fenster gibt es vorläufig nicht: zuviel Aufwand für zuwenig Nutzen.

variable line
Wenn Ihre Daten in der ersten Zeile eine kurze Beschreibung (z.B. Namen) der Variablen tragen, so ist dieses Flag zu aktivieren.

field delimiter
Ihre Daten werden als Character Separated Values erwartet, d.h. die einzelnen Zellen einer Zeile werden durch ein Spezial-Zeichen voneinander getrennt. Oft ist dies der Tabulator, aber auch das Semikolon ist dafür üblich. In diesem Feld können Sie das Trennzeichen definieren; vorgegeben ist der Tabulator.
Anmerkung: Manche Systeme machen es schwer, diesen vordefinierten Tabulator zu sehen oder selbst einen einzutragen; in diesem Fall bleibt es Ihrer Geduld oder Systemerfahrung überlassen, einen Ausweg zu finden. Spätere MARC-Versionen können vielleicht '\t' verstehen; diese kann es nicht.

pre-defined missings: global
Wenn eine Kategorie in allen Variablen als Missing Value interpretiert werden soll, so können Sie diese Kategorie hier eintragen. Sie können auch mehrere Kategorien eintragen, die dann durch das o.g. Trennzeichen getrennt sein müssen.
Achtung: Für MARC ist jedes Leerzeichen oder sonstiger WhiteSpace signifikant!

pre-defined missings: binary
Wenn eine Kategorie in allen binären (=zweiwertigen) Variablen als Missing Value interpretiert werden soll, so können Sie diese Kategorie hier eintragen. Weiteres wie oben.

pre-defined missings: var cat
Hier können Sie beliebig viele Variablen-Kategorien-Paare (wie oben getrennt) angeben, die ebenfalls als Missings interpretiert werden.

read
Dieser Knopf löst das Einlesen Ihrer Daten aus. Die vorhandenen Variablen, ihre Kategorien und die Anzahl der Transaktionen werden bestimmt und ein Compute-Fenster erzeugt.


[Uni Augsburg]  [Math.-Nat. Tech. Fakultät]  [Institut für Mathematik]  [Autor]  [E-Mail]  [Print-Version]  aktualisiert am: 23.10.2023;  © Uni Augsburg