Skip to content
S

swiss-dial-samples

SwissDial

The first annotated parallel corpus of spoken Swiss German across 8 major dialects (AG, BE, BS, GR, LU, SG, VS, ZH). The data set includes around 3 hours of high quality audio per dialect together with Swiss German and High German transcripts. The data is freely available to the research community and can be used to explore speech synthesis methods and other technologies dealing with Swiss German texts, such as dialect identification, machine translation, or even to explore linguistic properties of the various dialects.

More details can be found in the paper:
SwissDial paper

The data set can be downloaded here:
SwissDial dataset

Samples from the Dataset

Sample 1

High German Sentence: Die Schweizer treffen im Final auf Russland, das die Slowakei im anderen Halbfinal mit drei zu zwei nach Penaltyschiessen niederrang.
Thema: sport
Code-switching: false

AG: D'Schwizer träffe em Final of Russland, die hend em Halbfinal d'Slowakei em Penaltyschüsse mit drü zo zwoi usegschosse.
ch_ag_1682.wav
BE: D Schwizer träffä im Finau uf Russland, wod Slowakei im angerä Haubfinau mit drü zu zwöi nach Penaltyschiesse het besiegt.
ch_be_1682.wav
BS: D Schwiizer träffe im Final uf Russland, wo d Slowakei im andere Halbfinal mit drei zu zwei nach em Penaltyschiesse besiegt het.
ch_bs_1682.wav
GR: D Schwizer treffen im Final uf Russland, wo d Slowakei im andera Halbfinal mit drei zu zwei noch Penaltyschüssa nieder grunga het.
ch_gr_1682.wav
LU: D Schwiizer träffed em Final uf Rossland. Die hend d Slowakei em andere Halbfinal mit emene drü zo zwoi em Penaltyschiesse bezwonge.
ch_lu_1682.wav
SG: dSchwiizer treffed im Final uf Russland, wo dSlowakei im andere Halbfinal mit drü zwei nochem Penaltyschüsse abegrunge het.
ch_sg_1682.wav
VS: D'Schwizer träffunt im Final uf Russland, wa d'Slowakei im andru Halbfinal mit drii zu zwei nah Penaltyschiessu nidergrungu het.
ch_ws_1682.wav
ZH: D Schwizer träffed im Finale uf Russland, wo d Slowakei im andere Halbfinale mit drü zu zwei im Penaltyschüsse besiegt hät.
ch_zh_1682.wav

Sample 2

High German Sentence: Blair hatte sich unbemerkt in seinen Rücken geschlichen.
Thema: special
Code-switching: true

AG: D'Blair het sech onbemerkt e sin Rögge gschleche.
ch_ag_2547.wav
BE: Dr Blair hetsech unbemerkt i si Rüggä gschlichä.
ch_be_2547.wav
BS: D Blair het sich unbemerkt hinter si Rugge gschliche.
ch_bs_2547.wav
GR: Dr Blair het sich unbemerkt in sin Rucka gschlicha.
ch_gr_2547.wav
LU: De Blair hed sech onbemerkt hender sine Rögge gschleche.
ch_lu_2547.wav
SG: De Blair het sich unbemerkt i sin Rugge gschliche.
ch_sg_2547.wav
VS: Die Blair het schi unbemerkt in schine Rigg gschlichu.
ch_ws_2547.wav
ZH: D Blair hät sich unbemärkt hinter sin Rugge gschliche.
ch_zh_2547.wav

Results with Single Speaker Tacotron followed by Wavenet

(All of the below phrases are unseen by Tacotron and Wavenet.)

Example 1: Wir leben im Zeitalter der Technik.

AG: Mer läbe em Zitalter fode Technik.
ag_0.wav
BE: Mir läbe im Zitauter vor Technik.
be_0.wav
BS: Mir läbe im Ziitalter vo dr Technik.
bs_0.wav
GR: Miar lebend im Ziitalter vu dr Technik.
gr_0.wav
LU: Mer läbend im Ziitalter vo de Technik.
lu_0.wav
SG: Mir lebed im Ziitalter vo de Technik.
sg_0.wav
VS: Wier läbe im Zitalter vaner Technik.
ws_0.wav
ZH: Mir läbed im Zitalter vode Technik.
zh_0.wav

Example 2: Frau Klein ist über achtzig, aber sie ist noch sehr aktiv.

AG: D’Frau Klein esch öber achtzgi, aber sie esch no sehr aktiv.
ag_1.wav
BE: D Frou Klein isch über achtzgi, aber sie isch no sehr aktiv.
be_1.wav
BS: D Frau Klein isch über achzig, aber si isch no sehr aktiv.
bs_1.wav
GR: D Frau Klein isch über achtzig, aber sie isch no sehr aktiv.
gr_1.wav
LU: D Frau Klein esch öber achzgi, sie esch aber no sehr aktiv.
lu_1.wav
SG: dFrau Klein isch über achzg, aber si isch no sehr aktiv.
sg_1.wav
VS: D'Fröi Chlei isch uber achzg, aber schi isch nu sehr aktiv.
ws_1.wav
ZH: D Frau Klein isch über achzgi, aber si isch no sehr aktiv.
zh_1.wav

Example 3: Die besten Kuchen, die ich jemals gegessen habe, sind die, welche meine Mutter gebacken hat.

AG: Die beschte Chüeche woni jemols gässe han, send die wo mini Muetter bache het.
ag_2.wav
BE: Die beschte Chüeche, woni je ha gässe, si die, wo mini Mueter bachet het.
be_2.wav
BS: Die beste Küeche, wo ich je gässe ha, sind die, wo mini Mueter backe het.
bs_2.wav
GR: Dia besta Kuacha, wo i jemols gessa han, sind dia, welli mini Muatter bacha het.
gr_2.wav
LU: Die beschte Chueche woni jeh gässe ha, sind die wo mini Muetter backe hed.
lu_2.wav
SG: Di beste Chüeche, woni jemols gesse ha, sind die, wo mini Muetter bache het.
sg_2.wav
VS: Die beschtu Chiechu, wani jemals gässu ha, sind die, wa mini Müetter gibachu het.
ws_2.wav
ZH: Di beste Chüeche woni je gässe han sind die wo mini Mueter bached hät.
zh_2.wav

Example 4: Zwischen die französischen Anführungszeichen und ihren Inhalt setzt man immer ein schmales Leerzeichen wenn sie Dialoge einfassen.

AG: Zwösche de französische Afüehrigszeiche ond erne Inhalt setzt mer emmer es schmols Leerzeiche wenn mer Dialög erfasst.
ag_3.wav
BE: Zwüschä diä französischä Aafüerigszeiche und ire Inhaut setzt me immer es schmaus Läärzeichä wenn sie Dialög tüe iifassä.
be_3.wav
BS: Zwüsche de französische Ahfüehrigszeiche und ihrem Inhalt setzt me immer ä schmals Leerzeiche wenn si Dialög ihfasse.
bs_3.wav
GR: Zwüscha da französischa Afüahrigszeicha und ihra Inhalt setzt ma immer as schmals Leerzeicha wenn sie Dialog iifassend.
gr_3.wav
LU: Zwösche de französische Afüehrigszeiche und ihrem Inhalt setzt mer emmer es schmals Lärzeiche wenn sie Dialög ifassend.
lu_3.wav
SG: Zwüsched de französische Afüerigszeiche und ihrem Inhalt setzt me immer e schmals Leerzeiche, wenn sie Dialög iifassed.
sg_3.wav
VS: Zwischu de französischu Ahfirehrigszeichu und ihrusch Ihalt setzt mu immer es schmals Läärzeichu wenn schi Dialogi ihfassunt.
ws_3.wav
ZH: Zwüsched di französische Ahfüerigszeiche und dene ihre Inhalt tut mer immer es schmals Lärzeiche wenn si Dialög beinhalted.
zh_3.wav

Example 5: Mein Fahrlehrer sagt, ich solle mehr Geduld haben.

AG: Min Fahrlehrer het gseit ich söll meh Gedold ha.
ag_4.wav
BE: Mi Fahrlehrer seit, ig söui meh Geduud ha.
be_4.wav
BS: Mi Fahrlehrer seit, ich söll mehr Geduld ha.
bs_4.wav
GR: Min Fahrlehrer seit, i sölli meh Geduld ha.
gr_4.wav
LU: Min Fahrlehrer het gseit, dass ech meh Geduld söll ha.
lu_4.wav
SG: Min Fahrerlehrer seit, i söt meh Geduld ha.
sg_4.wav
VS: Mine Fahrlehrer seit, ich selle meh Geduld ha.
ws_4.wav
ZH: Min Fahrlehrer seit, ich söll meh Geduld ha.
zh_4.wav

Results with Multi-Speaker Multi-Dialect Tacotron followed by Wavenet

(All of the below phrases are unseen by Tacotron and Wavenet during training.)
(All of the below phrases are unseen by Tacotron and Wavenet.)

Example 1: Wir leben im Zeitalter der Technik.

BE: Mir läbe im Zitauter vor Technik.
be_5.wav
GR: Miar lebend im Ziitalter vu dr Technik.
gr_5.wav
SG: Mir lebed im Ziitalter vo de Technik.
sg_5.wav
VS: Wier läbe im Zitalter vaner Technik.
ws_5.wav
ZH: Mir läbed im Zitalter vode Technik.
zh_5.wav

Example 2: Frau Klein ist über achtzig, aber sie ist noch sehr aktiv.

BE: D Frou Klein isch über achtzgi, aber sie isch no sehr aktiv.
be_6.wav
GR: D Frau Klein isch über achtzig, aber sie isch no sehr aktiv.
gr_6.wav
SG: dFrau Klein isch über achzg, aber si isch no sehr aktiv.
sg_6.wav
VS: D'Fröi Chlei isch uber achzg, aber schi isch nu sehr aktiv.
ws_6.wav
ZH: D Frau Klein isch über achzgi, aber si isch no sehr aktiv.
zh_6.wav

Code-Switching (CS) Results

You can find sample code-switching results below. The main language of the sentences is Bernese dialect while the underlined words are in English.
(All of the below phrases are unseen by Tacotron and Wavenet during training.)

Mir läbe im Age vor Technik.
cs_be_0.wav
Die beschtä Cakes, woni je ha gässä, si die, wo mini Mueter bachet het.
cs_be_1.wav
Mi Fahrlehrer seit, i söu meh Patience ha.
cs_be_2.wav
Versuech bitte chli weniger luut z si, thanks.
cs_be_3.wav

Results with Multi-Speaker Multi-Dialect Tacotron followed by Wavenet

(The sentences below are the intermediate translation output of the pipeline)
(All of the below phrases are unseen by Tacotron and Wavenet. The sentences below in dialect are the intermediate translation output of the pipeline.)

Example 1: Wir leben im Zeitalter der Technik.

BE: mir läbä im zitauter vor technik.
be_7.wav
GR: miar leben im ziitalter dr technik.
gr_7.wav
SG: mir lebed im ziitalter de technik.
sg_7.wav
VS: mir läbu im zitalter der technik.
ws_7.wav
ZH: mir läbu im zitalter der technik.
zh_7.wav

Example 2: In den Bergen einzelne Schauer wahrscheinlich. Schneefallgrenze um 2300 Meter.

BE: idä bärgä einzelni schauer wahrschinlech. schneefaugränzä um zwöitusigdrühundert meter.
be_8.wav
GR: in da berga einzelni schauer wohrschinli. schneefallgrenza um zweituusigdreihundert meter.
be_8.wav
SG: i de berge einzelni schauer wohrschinli. schneefallgrenze um zweituusigdrühundert meter.
sg_8.wav
VS: ine bärgu einzelni schauer wahrschinli. schneefallgränzu um zweitüüsigdriihunert meter.
ws_8.wav
ZH: ide berge einzelni schauer wahrschindli. schneefallgränze um zweitusigdrühundert meter.
zh_8.wav