Vyhrává častěji bílý než černý?

Logo CVUT-FEL
->Záhlaví
->Úvod
->Hypotéza
->Naměřené hodnoty
->Výpočet
->Program
->Závěr
->Použitá literatura

Záhlaví

Jméno studenta: David Šafránek
Studijní skupina: 442
Semestr, školní rok: letní 2004/2005
Katedra: Matematiky (K 13101)
Předmět: Matematika 6F (01M6F)
Seminář: čtvrtek 14:30
Cvičící: RNDr Libor Nentvich
Přednášející: Ing. Mirko Navara, CSc.
Datum: 22.5.2005
 

Úvod

Budeme se zabývat jaký má vliv barva figur na výsledek partie v klasickém šachu. Bude nás zajímat, zda a jaká je výhoda hrát za bílé figury a mít tak „výhodu“ práva prvního tahu. K přesnější analýze použijeme i Ela (údaji o výkonnosti hráče). Možné výsledky partie jsou tři – 1:0, ½:½, 0:1, * (bez výsledku). Vyřadíme-li remízu a * jedná se o alternativní rozdělení.

Co je Elo?

Elo je celočíselná hodnota větší než 1250, která udává herní sílu hráče. Z rozdílu Ela dvou hráčů zjistíme jaký je nejpravděpodobnější výsledek jejich duelu (nazveme jej F), o barvách zde však není ani zmínky. Zde je tabulka a graf rozdílů. K této funkci existuje samozdřejmě i inverzní funkce, kdy z výsledku jsme schopni určit rozdíl ELA hráčů. Jak je vidět tuto funkci lze v případě nutnosti nahradit v rozsahu ‹15%; 85%› lineární funkcí.

Hypotéza

Budeme uvažovat, že pro bílého je výhodné táhnout jako první (u jiných deskových her to však může být naopak nevýhoda).

Nulová hypotéza (H0):Bílý vyhrává častěji(F > 0,5)
Alternativní hypotéza (H1):Barvy jsou si rovnocenné nebo naopak vyhrává černý(F ≤ 0,5)

Naměřené hodnoty

Reprezentativnost výběru

Jako vzorek nám poslouží šachová databáze partií v pgn formě. Jako zdrojová data nepoužijeme jen údaje o výsledku partie, ale i Ela obou hráčů, abychom tak zajistili, že za bílé i černé hráli stejně silní hráči. Z našich dat jsem zjistil průměrnou odchylku 1,76 elo bodu na partii pro bílého, vzhledem k její velikosti ji mohu zanedbat. Soubory dat, které jsme použili jsem náhodně našel na internetu, takře se jedná záznamy z několika nezávislích turnajů. Největší problém nastal, při schánění výsledků slabších hráčů, protože k dispozici byli většinou jen výsledky lepších hráčů. O dvoustupňový výběr by se jednalo použily bysme z jednoho turnaje jen některé partie, vzhledem k tomu, že nám nic nebrání k tomu použít všechny použijeme je.

Kompletní použité data jsou zde.

Výpočet

Řešení

Pro výpočet použijeme Bernoulliho větu, která nám udá pravděpodobnost, že výsledek spadá do itervalu nad 0,5.

ε ← EY − 0,5

P(Y − EY ≥ ε) ≤ var Y ⁄ ε²

Z výsledků je patrné, že na hladině významnosti daleko menší než 1% bílý vyhrává častěji než černý. Nyní ještě zvýšíme Ela bílých hráčů tak, aby výsledek byl 0,5. Výsledkem je, že bílé figury přidají k rozdílu 59 Elo bodů.

Nyní se však můžeme ptát jak je to významné z hlediska Elo výkonosti hráčů, k tomuto výsledku už remízi použijeme. Rozdělíme-li partie podle průměru El jejich hráčů a seřadíme do skupin, a podíváme-li se do grafu, tak zjevně žádná významná závislost není, a tudíž výhoda barvy je pro všechny úrovně hráčů stejná. Jediné co lze vypozorovat je to, že u špičkových hráčů s Elem nad 2400 dochází ke zvýšení počtu remíz a naopak u slabších hráčů pod 1400 je remíz méně.

Program

Pro zpracování jsme měli k dispozici soubory ve formátu pgn. Využili jsme tagů WhiteElo, BlackElo a Result. Náš program tyto tagy ze souboru vytáhne a spočte dané statistiky. Část zdrojového kódu algoritmu je zde.

Závěr

Vzhledem k výsledkům je patrné, že by bylo vhodné tuto korekci zavéct při počítání nového ela, protože sehraje-li hráč za sezónu partie převážně s jedou barvou může to mít vliv až několik desítek (v krajním případě 59) elo bodů. Jelikož by to vžak znamenalo zaznamenávat kromě výsledku a El soupeřů také barvy, tak k tomu zatím Český šachový svaz nepřistoupil, ale vzhledem k tomu, že v propozicích nastávají občas změny (jako např. je-li rozdíl hráčů větší než 350 počítá se jako 350), tak je docela možné, že někdy dojde ke zpracování takovéto statistické studie, ze které se výsledky použijí pro praktické úpravy propozic.

Použitá literatura

[1] Vladimír Rogalewicz: Pravděpodobnost a statistika pro inženýry, ČVUT 2000
[2] ELO ČR
[3] Česká šachová federace
[4] Specifikace PGN