Záhlaví | |
Úvod | |
Hypotéza | |
Naměřené hodnoty | |
Výpočet | |
Program | |
Závěr | |
Použitá literatura |
Jméno studenta: | David Šafránek |
Studijní skupina: | 442 |
Semestr, školní rok: | letní 2004/2005 |
Katedra: | Matematiky (K 13101) |
Předmět: | Matematika 6F (01M6F) |
Seminář: | čtvrtek 14:30 |
Cvičící: | RNDr Libor Nentvich |
Přednášející: | Ing. Mirko Navara, CSc. |
Datum: | 22.5.2005 |
Budeme se zabývat jaký má vliv barva figur na výsledek partie v klasickém šachu. Bude nás zajímat, zda a jaká je výhoda hrát za bílé figury a mít tak „výhodu“ práva prvního tahu. K přesnější analýze použijeme i Ela (údaji o výkonnosti hráče). Možné výsledky partie jsou tři – 1:0, ½:½, 0:1, * (bez výsledku). Vyřadíme-li remízu a * jedná se o alternativní rozdělení.
Elo je celočíselná hodnota větší než 1250, která udává herní sílu hráče. Z rozdílu Ela dvou hráčů zjistíme jaký je nejpravděpodobnější výsledek jejich duelu (nazveme jej F), o barvách zde však není ani zmínky. Zde je tabulka a graf rozdílů. K této funkci existuje samozdřejmě i inverzní funkce, kdy z výsledku jsme schopni určit rozdíl ELA hráčů. Jak je vidět tuto funkci lze v případě nutnosti nahradit v rozsahu ‹15%; 85%› lineární funkcí.
Budeme uvažovat, že pro bílého je výhodné táhnout jako první (u jiných deskových her to však může být naopak nevýhoda).
Nulová hypotéza (H0): | Bílý vyhrává častěji | (F > 0,5) |
Alternativní hypotéza (H1): | Barvy jsou si rovnocenné nebo naopak vyhrává černý | (F ≤ 0,5) |
Jako vzorek nám poslouží šachová databáze partií v pgn formě. Jako zdrojová data nepoužijeme jen údaje o výsledku partie, ale i Ela obou hráčů, abychom tak zajistili, že za bílé i černé hráli stejně silní hráči. Z našich dat jsem zjistil průměrnou odchylku 1,76 elo bodu na partii pro bílého, vzhledem k její velikosti ji mohu zanedbat. Soubory dat, které jsme použili jsem náhodně našel na internetu, takře se jedná záznamy z několika nezávislích turnajů. Největší problém nastal, při schánění výsledků slabších hráčů, protože k dispozici byli většinou jen výsledky lepších hráčů. O dvoustupňový výběr by se jednalo použily bysme z jednoho turnaje jen některé partie, vzhledem k tomu, že nám nic nebrání k tomu použít všechny použijeme je.
Kompletní použité data jsou zde.
Pro výpočet použijeme Bernoulliho větu, která nám udá pravděpodobnost, že výsledek spadá do itervalu nad 0,5.
ε ← EY − 0,5
P(Y − EY ≥ ε) ≤ var Y ⁄ ε²
Z výsledků je patrné, že na hladině významnosti daleko menší než 1% bílý vyhrává častěji než černý.
Nyní ještě zvýšíme Ela bílých hráčů tak, aby výsledek byl 0,5. Výsledkem je, že bílé figury přidají k rozdílu 59 Elo bodů.
Nyní se však můžeme ptát jak je to významné z hlediska Elo výkonosti hráčů, k tomuto výsledku už remízi použijeme. Rozdělíme-li partie podle průměru El jejich hráčů a seřadíme do skupin, a podíváme-li se do grafu, tak zjevně žádná významná závislost není, a tudíž výhoda barvy je pro všechny úrovně hráčů stejná. Jediné co lze vypozorovat je to, že u špičkových hráčů s Elem nad 2400 dochází ke zvýšení počtu remíz a naopak u slabších hráčů pod 1400 je remíz méně.
Pro zpracování jsme měli k dispozici soubory ve formátu pgn. Využili jsme tagů WhiteElo, BlackElo a Result. Náš program tyto tagy ze souboru vytáhne a spočte dané statistiky. Část zdrojového kódu algoritmu je zde.
Vzhledem k výsledkům je patrné, že by bylo vhodné tuto korekci zavéct při počítání nového ela, protože sehraje-li hráč za sezónu partie převážně s jedou barvou může to mít vliv až několik desítek (v krajním případě 59) elo bodů. Jelikož by to vžak znamenalo zaznamenávat kromě výsledku a El soupeřů také barvy, tak k tomu zatím Český šachový svaz nepřistoupil, ale vzhledem k tomu, že v propozicích nastávají občas změny (jako např. je-li rozdíl hráčů větší než 350 počítá se jako 350), tak je docela možné, že někdy dojde ke zpracování takovéto statistické studie, ze které se výsledky použijí pro praktické úpravy propozic.