Statistická analýza díla W. A. Mozarta

(Projekt do předmětu Statistika I na jaře 2006.)

Jako základní soubor jsem zvolil všechny skladby, které seřadil a očísloval Ludwig Ritter von Köchel (1800–1877). Jedná se o tzv. Chronologisch-thematisches Verzeichnis sämtlicher Tonwerke Wolfgang Amadé Mozarts. Jako jediný (z několika novějších revizí) ho mám k dispozici kompletní. Tento katalog není rozčleněn podle druhů skladeb. Zčásti zachovává dobu vzniku skladeb, což je ovšem někdy problém, protože některé skladby byly psány v delším časovém úseku a některé byly objeveny dodatečně. Navíc u některých skladeb je pochybnost o vytvoření samotným Mozartem. Přistoupil jsem proto k následujícím opatřením (která řeší i další problémy): pokud bylo zjištěno falešné přisouzení některé skladby, která díky tomu byla později vyřazena z KV (číslo zůstalo nepřiřazené), do výběrového souboru ji nezařazuji. Pokud se dílo (např. opera) skládá z několika dílčích skladeb, která jsou pod jedním číslem v KV, do souboru je zařazuji, ale nepřiřazuji dílu žádnou tóninu – jde většinou o skladby v různých tóninách.

Nyní přistoupíme k popisu dat. Vektorový znak označíme (T,M), kde znak T značí tóninu a znak M mód. Počet variant znaku T je 11 (C, D, E, F, G, A, H, As, Es, B, Fis). Počet variant znaku M je 2 (moll, dur). Všimněme si, že až máme k dispozici 30 různých tónin, Mozart použil ve všech svých skladbách pouze 21 z nich. Mohutnost základního souboru je 626, ovšem do datového souboru (po vynechání nepřiřazených čísel), se dostalo pouze 558 objektů (skladeb). Tedy rozsah datového souboru je n=558. Nechť j vyjadřuje číslo (od 1 do 12), které odpovídá variantě znaku T a k podobně pro znak M (1 a 2). Můžeme nyní pracovat s pojmy absolutní četnost dvojice (njk = N(T = t[j] a zároveň M = m[k])) a relativní četnost dvojice (pjk = njk / n).

Nyní popišme tabulku. Sloupec »tónina« obsahuje všechny varianty znaku T. Sloupec »dur« obsahuje absolutní četnosti znaku M pro hodnotu dur. Podobně sloupec »moll«. Suma na každém řádku vyjadřuje absolutní četnost znaku T pro hodnotu tóniny, která je na příslušném řádku. Řádek »Soubor« obsahuje pouze jednu položku – a to počet takových objektů, kterým nebyl přiřazen ani jeden znak. (Viz výše.) Poslední řádek se sumou obsahuje absolutní četnosti znaku M pro hodnoty dur a moll a nakonec celkový počet všech vybraných objektů. Jedná se o kontigenční tabulku, neboť obsahuje simultánní četnost znaků T a M. V posledním sloupci a posledním řádku nalezneme marginální četnosti jednotlivých hodnot znaků.

#tóninadurmollΣ
1C821597
2D821395
3E527
4F68371
5G471057
6A29635
7H123
8As415
9Es51152
10B66167
11Fis606
12Soubor--63
Σ44154558

Z výše uvedených grafů je vidět, že u Mozarta převládají skladby v durovém modu (znak M). Dané pozorování vyvozujeme z hodnoty relativní četnosti pro y[dur]. Souhlasí to s tvrzeními v literatuře. Navíc lze pozorovat (znak T), že Mozart psal skladby v tóninách s minimálním předznamenáním. Nejvíce skladeb je napsáno v C dur a D dur (viz první tabulka) – absolutní četnost skladeb v těchto tóninách je 82, nejedná se o nic jiného, než o absolutní četnost dvojice (x[C],y[dur]) resp. (x[D],y[dur]).

Mozartovo dílo by se dalo analyzovat mnohem podrobněji – mohli bychom například studovat jednotlivé druhy skladeb, třídit do podmožin datového souboru podle nástrojového obsazení (obecně je zvyklost psát pro dechové nástroje, které jsou v ladění C, B, Es apod. skladby v tóninách s béčky v předznamenání, naopak pro smyčcové nástroje s křížky). Není také divu, že tóniny s největším předznamenáním Mozart použil ve skladbách pro klávesový nástroj (případně pro hlas s doprovodem klavíru). Zde počet křížků a béček nehraje roli.

Použitá literatura

Druhá verze (TeX)

Dal jsem si za úkol zkoumat zastoupení jednotlivých tónin a módů ve skladbách W.~A.~Mozarta. Je známo, že komponoval převážně v durových tóninách, zajímala mne přesnější čísla.

Jako základní soubor jsem zvolil všechny skladby, které seřadil a očísloval Ludwig Ritter von Köchel (1800–1877). Jedná se o tzv. {\it Chronologisch-thematisches Verzeichnis sämtlicher Tonwerke Wolfgang Amadé Mozarts}. Tento katalog není rozčleněn podle druhů skladeb. Zčásti zachovává dobu vzniku skladeb, což je ovšem někdy problematické, protože některé skladby byly psány v~delším časovém úseku a některé byly objeveny dodatečně. Navíc u některých skladeb je pochybnost o vytvoření samotným Mozartem. Přistoupil jsem proto k~následujícím opatřením (která řeší i další problémy): pokud bylo zjištěno falešné přisouzení některé skladby, která díky tomu byla vyřazena z~KV (číslo ale zůstalo nepřiřazené), do výběrového souboru ji nezařazuji. Pokud se dílo (např. opera) skládá z~několika dílčích skladeb, které jsou pod jedním číslem v~KV, do souboru je zařazuji, ale nepřiřazuji dílu žádnou tóninu – jde totiž většinou o skladby v~různých tóninách.

Nyní přistoupíme k~popisu dat. Vektorový znak označíme $(T,M)$, kde znak $T$ značí tóninu a znak $M$ mód skladby. Počet variant znaku $T$ je 11 (C, D, E, F, G, A, H, As, Es, B, Fis), znaku $M$ 2 (moll, dur). Všimněme si, že ač existuje 30 různých tónin, Mozart použil ve svých skladbách pouze 21 z~nich. Mohutnost základního souboru je 626, ovšem do datového souboru (po vynechání nepřiřazených čísel), se dostalo pouze 558 objektů (skladeb). Tedy rozsah datového souboru je $n=558$. Nechť $j$ vyjadřuje číslo od 1 do 12, které odpovídá variantě znaku $T$ (C je 1, D 2 atd., viz tabulku) a číslo $k$ podobně pro znak $M$. Můžeme nyní pracovat s~pojmy absolutní četnost dvojice $$n_{jk} = N(T = t_{[j]} \wedge M = m_{[k]})$$ a relativní četnost dvojice: $$p_{jk} = {n_{jk} \over n}.$$

Nyní popíšeme tabulku. Sloupec »tónina« obsahuje všechny varianty znaku $T$. Sloupec »dur« obsahuje absolutní četnosti znaku $M$ pro hodnotu dur. Podobně sloupec »moll«. Suma na každém řádku vyjadřuje absolutní četnost znaku $T$ pro hodnotu tóniny, která je na příslušném řádku. Jde o marginální četnostní funkci. Řádek »Soubor« obsahuje pouze jednu položku – a to počet takových objektů, kterým nebyl přiřazen ani jeden znak. (Viz výše.) Poslední řádek se sumou obsahuje absolutní četnosti znaku $M$ a nakonec celkový počet všech objektů. Jedná se o kontigenční tabulku, neboť obsahuje simultánní četnost znaků $T$ a $M$. V posledním sloupci a posledním řádku nalezneme marginální četnostní funkci jednotlivých hodnot znaků.

Z~uvedených grafů je vidět, že u Mozarta převládají skladby v~durovém módu (znak $M$). Dané pozorování vychází z~hodnoty relativní marginální četnosti pro $y_{[{\rm dur}]}$ (cca 0,79). Navíc lze pozorovat (znak $T$), že Mozart psal skladby v~tóninách s~minimálním předznamenáním. Nejvíce skladeb je napsáno v~C~dur a D~dur. Počet skladeb v~těchto tóninách je 82, nejedná se o nic jiného, než o absolutní četnost dvojice $(x_{[{\rm C}]},y_{[{\rm dur}]})$ resp. $(x_{[{\rm D}]},y_{[{\rm dur}]})$. Jelikož se v~našem případě jedná o nominální znaky (mezi tóninami není definováno uspořádání), nemá určování aritmetického průměru, průměrné odchylky či rozptylu smysl. Vyšlo by nám velice pravděpodobně reálné číslo, ale jak bychom ho interpretovali? Můžeme ovšem určit empirický modem. Pro znak $T$ je to $\hat x = 1$ (tónina c) a pro znak $M$ $\hat y = 1$ (mód dur). Není tedy divu, že si každý pod pojmem Mozartova hudba představí veselou melodii, když v Mozartově tvorbě tolik převládají skladby v durovém módu.

published: 2006-05-15
last modified: 2023-01-21

https://vit.baisa.cz/notes/informatics/fi-stat-mozart.cs/