Aufbau des Korpus

Sessions

Die Grundeinheit des Korpus bilden sog. Sessions. Unter Session sind alle Daten gemeint, die im Zusammenhang mit einer einzelnen Aufnahme stehen. Hierzu gehören im "Vollständigen Korpus":

 

•die Sprachaufnahme selbst (WAV-Format),
•die Transkription (in ELAN, Transcriber und PDF)
•evtl. Materialien, die zur Elizitierung verwendet wurden (Bild in JPG-Format und Kurzfilme in AVI-Format).

 

Im "Kleinen Korpus" sind die Sprachaufnahmen in MP3-Format und die Transkription in PDF.

 

Die Daten einer einzigen Session werden in einem Ordner zusammengefasst. Im Laufe einer einzigen Sitzung mit der jeweiligen Sprecherin entstehen also in der Regel mehrere Sessions.

 

 

 

Schematisch ist das Korpus auf drei Ebenen wie folgt zusammengebaut:

1. Die oberste Ebene besteht aus 6 Ordnern (L2D_G1, L2D_G2, L2D_G3, L2D_G4, L2D_G5, L2D_G6). Diese beinhalten Sprachdaten von jeweils einer Sprecherin, sind mit dem entsprechenden Sprecherkürzel gekennzeichnet und können einzeln unter Daten heruntergeladen werden.

 

2. Auf der zweiten Ebene (in den Ordern L2D_G1, L2D_G2 usw.) befinden sich je eine PDF-Datei mit den Informationen über die Sprecherin sowie weitere Ordner, in denen sich die Sprachdaten der einzelnen Sitzung befinden. Diese Ordner sind nach dem Datum der Aufnahme benannt, z.B. L2D_G1_071119 = Sprachdaten der Sprecherin G1, aufgenommen am 19.11. 2007.

 

3. Die dritte Ebene (z.B. im Ordner L2D_G1_071119) beinhaltet die einzelnen Session-Ordner, die chronologisch durch Buchstaben gekennzeichnet werden (z. B. L2D_G1_071119a = erste Session mit der Sprecherin G1, aufgenommen am 19.11.2007 usw.). Darüber hinaus enthält jeder Ordner auf dieser Ebene ein Protokoll im PDF-Format, der den Ablauf der Sitzung an dem betreffenden Tag dokumentiert.