Das Kieler Korpus Deutsch als Zweitsprache (KiKoDaZ)

Allgemein

Das Korpus wurde erstellt von Geoffrey Haig unter Mitarbeit von Csilla Kász.

 

 

Das KiKoDaZ enthält Aufnahmen von Gesprächen, die zwischen deutschsprachigen Studierenden und erwachsenen Deutschlernerinnen mit überwiegend kurdischer bzw. arabischer Muttersprache stattfanden. Zu jeder Aufnahme gibt es Transkripte, die mit der Aufnahme verlinkt sind, sowie eine reine Textversion im pdf-Format.

 

Die Daten stehen außschließlich für wissenschaftliche Zwecke zur Verfügung. Unter dem Link Korpus als Textausgabe ist das gesamte Korpus (nur die Aussagen der Sprecherinnen) als Texdatei (DOC- und PDF-Format) zugänglich. Um einen Zugang zu den vollständigen Daten zu erhalten, brauchen Sie einen Benutzername sowie ein Passwort, die Sie per Email durch einen formlosen Antrag mit Angabe der Forschungseinrichtung bzw. des Projektes, für den die Daten bestimmt sind, an admin(at)linguistik.uni-kiel.de erlangen. Weitere Informationen zum Hintergrund, Aufbau und Methodik des Korpus finden Sie unter den Links auf dieser Seite.

 

Bei der Datenerhebung und Aufarbeitung haben folgende Studenten/innen mitgearbeitet:

 

Kristin Ameis

Katja Becker

Julia Dammann

Anna David

David Georgi

Friederike Greuel

Iris Helming

Annika Kalthegener

Csilla Kász

Merle Knudsen

Lena Nissen

Mirijam Räker

Natalia Samsonova

Lena Schindler

Claudia Schlichting

Imme Winckelmann

 

 

Herzlichen Dank gilt den Lehrkräften des Integrationskurses der AWO.

Projekthintergrund

Die Daten wurden im Wintersemester 2007/2008 im Rahmen eines Hauptseminars "Zweitspracherwerb", das an der Christian-Albrechts-Universität zu Kiel unter der Leitung von PD. Dr. Geoffrey Haig durchgeführt wurde, erhoben. Sie stammen ausschließlich von erwachsenen Sprecherinnen mit arabischer und/oder zentral- bzw. nordkurdischer Muttersprache. Alle Sprecherinnen haben an einem Integrationskurs teilgenommen, der an der Schule am Göteborgring im Kieler Stadtteil Mettenhof von Oktober 2007 bis Februar 2008 durch Lehrkräfte der Arbeiterwohlfahrt durchgeführt wurde. In den meisten Fällen handelt es sich um den ersten Deutschkurs, den die Teilnehmerinnen besucht haben, obwohl sie sich teilweise bereits mehrere Jahre in Deutschland aufhalten. Das Ziel des Projektes war, Primärsprachdaten zu erheben und aufzuarbeiten, die für die Untersuchung zum ungesteuerten Erwerb des Deutschen durch Erwachsene Aufschluss geben können.

 

Verlauf der Datenerhebung

Im Vorfeld nahm die Seminarleitung Kontakt zu den Lehrkräften der AWO auf und bat um die Erlaubnis, mit den Teilnehmerinnen am Deutschkurs regelmäßig Aufnahmen durchzuführen. Zunächst haben sich mehrere Kursteilnehmer bereit erklärt, an der Untersuchung teilzunehmen. Aufgrund der beschränkten Möglichkeiten musste jedoch eine Auswahl getroffen werden. Wir haben uns dafür entschieden, eine möglichst homogene Gruppe aufzunehmen. Es handelte sich um weibliche Personen aus dem Irak mit Erstsprache(n) Zentral-Kurdisch und/oder Arabisch. Die Studierenden wurden in Gruppen eingeteilt. Jede einzelne Sprecherin wurde anschließend von einer Gruppe von 3-4 Studenten "betreut", d.h. sie trafen sich in zweiwöchigen Intervallen, um unterschiedliche Sprachdaten zu erheben. Der Verlauf der Sitzungen mit der Informantin wurde von den Gruppen selbst gestaltet. Es wurden unterschiedliche Stimuli, beispielsweise Bilder, Spiele, Filme, Aufgaben usw, verwendet. Die Sitzungen wurden digital aufgenommen (WAV-Format) und die Daten anschließend von den Gruppen bearbeitet. Zunächst wurden die Daten mit dem Programm Transcriber verschriftet und ein Protokoll von jeder Sitzung aufbereitet, zu dem auch die bei den Aufnahmen verwendeten Materialien (Bildgeschichten usw.) gehörten. Das gesamte Material wurde am Seminar gesammelt, die verschrifteten Texte erneut korrigiert und für Archivierungszwecke aufgearbeitet.

Aufbau des Korpus

Sessions

Die Grundeinheit des Korpus bilden sog. Sessions. Unter Session sind alle Daten gemeint, die im Zusammenhang mit einer einzelnen Aufnahme stehen. Hierzu gehören im "Vollständigen Korpus":

 

•die Sprachaufnahme selbst (WAV-Format),
•die Transkription (in ELAN, Transcriber und PDF)
•evtl. Materialien, die zur Elizitierung verwendet wurden (Bild in JPG-Format und Kurzfilme in AVI-Format).

 

Im "Kleinen Korpus" sind die Sprachaufnahmen in MP3-Format und die Transkription in PDF.

 

Die Daten einer einzigen Session werden in einem Ordner zusammengefasst. Im Laufe einer einzigen Sitzung mit der jeweiligen Sprecherin entstehen also in der Regel mehrere Sessions.

 

 

 

Schematisch ist das Korpus auf drei Ebenen wie folgt zusammengebaut:

1. Die oberste Ebene besteht aus 6 Ordnern (L2D_G1, L2D_G2, L2D_G3, L2D_G4, L2D_G5, L2D_G6). Diese beinhalten Sprachdaten von jeweils einer Sprecherin, sind mit dem entsprechenden Sprecherkürzel gekennzeichnet und können einzeln unter Daten heruntergeladen werden.

 

2. Auf der zweiten Ebene (in den Ordern L2D_G1, L2D_G2 usw.) befinden sich je eine PDF-Datei mit den Informationen über die Sprecherin sowie weitere Ordner, in denen sich die Sprachdaten der einzelnen Sitzung befinden. Diese Ordner sind nach dem Datum der Aufnahme benannt, z.B. L2D_G1_071119 = Sprachdaten der Sprecherin G1, aufgenommen am 19.11. 2007.

 

3. Die dritte Ebene (z.B. im Ordner L2D_G1_071119) beinhaltet die einzelnen Session-Ordner, die chronologisch durch Buchstaben gekennzeichnet werden (z. B. L2D_G1_071119a = erste Session mit der Sprecherin G1, aufgenommen am 19.11.2007 usw.). Darüber hinaus enthält jeder Ordner auf dieser Ebene ein Protokoll im PDF-Format, der den Ablauf der Sitzung an dem betreffenden Tag dokumentiert.

Übersicht und Umfang der Daten

Sprecherkürzel

G1

G2

G3

G4

G5

G6

Insgesamt

Zahl der Session

22

12

13

24

14

29

113

Gesamtlänge der Session

(hh:mm:ss)

01:14:53

 

00:23:10

00:43:34

00:44:45

01:13:01

00:46:32

05:05: 55

Zugehörige Dateien (Ordner)

L2D_G1

 

L2D_G2

L2D_G3

L2D_G4

 

L2D_G5

L2D_G6

 

 

 

Die Übersicht finden Sie hier als pdf.

Daten der Sprecherinnen

Sprecher

G1

G2

G3

G4

G5

G6

Alter

24

20

26

35

36

35

Ankunft in Deutschland

2003

20.05.2005

2003

1999

25.04.1997

2002

Bisheriger Deutsch-unterricht

1. Deutschkurs bei AWO Kiel (Okt. 2007)

1. Deutschkurs bei AWO Kiel (Okt. 2007)

1. Deutschkurs in München (3 Monate)

2. Deutschkurs bei AWO Kiel (Okt. 2007)

1.Deutschkurs bei AWO Kiel (Okt. 2007)

1.Deutschkurs bei AWO Kiel (Okt. 2007)

1. Deutschkurs in München 3 Monate nach der Ankunft in Deutschland (3 Monate)

2. Deutschkurs bei AWO Kiel (Okt. 2007)

L1

Kurdisch

Kurdisch

Arabisch

Kurdisch

Kurdisch

Arabisch

Andere Sprach-kenntnisse

ein wenig Arabisch und Englisch

Arabisch

 

Arabisch und ein wenig Türkisch

Surani und Arabisch

Grundkenntnisse Englisch

Sprecherprofil (pdf)

Profil G1

Profil G2

Profil G3

Sprecherprofil leider nicht vorhanden

Sprecherprofil leider nicht vorhanden

Sprecherprofil leider nicht vorhanden

 

Korpus als Textausgabe

Ziel und Inhalt der Textausgabe

Die Textausgabe des KiKoDaZ wurde hauptsächlich von Frau Natalia Samsonova im Rahmen einer Hausarbeit erstellt. Sie enthält in einer Datei und in schriftlicher Form die kompletten Äußerungen aller L2-Sprecherinnen, die im Laufe des Projektes aufgenommen und archiviert wurden. Die Ausgabe wurde mit den folgenden Zielen erstellt: erstens, um einen schnellen Online-Einblick in die Gesamtheit der Daten zu ermöglichen, und zweitens um als Grundlage für eine etwaige Konkordanzanalyse der L2-Äußerungen zu dienen.
Aus der zweitgenannten Überlegung heraus wurden bei dieser Textausgabe lediglich die Äußerungen der L2-Sprecherinnen verschriftlicht; auf eine Verschriftung der Äußerungen der Interviewer wurde verzichtet. Dadurch ist der Sinnzusammenhang einzelner Äußerungen teilweise schwer erschließbar, jedoch lässt er sich durch Rückgriff auf die entsprechenden Transkripte bzw. Aufnahmen der jeweiligen Sessions leicht rekonstruieren. Im Mittelpunkt dieser Textausgabe stehen also die formalsprachlichen (etwa morphologischen und syntaktischen) Eigenschaften der L2-Sprache.

 

Hinweise zur Textausgabe des KiKoDaZ (PDF)

 

Korpus als Textausgabe (DOC)

 

Korpus als Textausgabe (PDF)