úterý 10. listopadu 2009

Hodnocení her, část 2/nejspíš-3

Poslední dobou se všude (u Overwatche a Tlamiczky :) píše o hodnocení her. Místo toho, abych psal dlouhé komentáře, které by si maximálně přečetli těch pár diskutujících, tak jsem se rozhodl, že napíšu dlouhý článek (který si snad přečte více lidí :). Ve druhé části se podíváme na průměr hodnocení, proč je tak vysoké a co s tím udělat.

Je vůbec průměr 7/10? Gamerankings na svých stránkách poskytují vyčerpávající seznam všech stránek, který kdy přispěly k hodnocení a průměrné hodnocení těchto stránek. Průměr všech 256 972 recenzí na Gamerankings je 72%. Takže ne, 7/10 je dokonce podprůměr :), přestože průměr by teoreticky měl být 5,5 (většina lidí si mylně myslí, že 5, přitom (1 + 10) / 2 = 5,5).

Otázka je, proč tomu tak je? Podle mě to nelze svést na jeden konkrétní důvod, je tu ale mnoho faktorů, které k tomu přispívají. Nejpodstatnější je podle mě vztah média s distributorem. Bylo to řečeno již tisíckrát; recenzent se nechce dostat do konfliktu s distributorem, protože následky by pro médium byly nepříznivé. Distributor by kvůli nízkému hodnocení mohl zrušit inzerci, odebrat časopisu exkluzivitu prvních recenzí příštích her či jim již nadále neposílat informace, trailery, screenshoty apod. a nezvat je na různé konference, show a prezentace. Kvůli tomuto mají výhodu tituly, které spadají pod velkého distributora, protože nepřízeň velkého a vlivného publishera je horší než nepřízeň malého publishera. Mám dobré důvody proč si myslet, že v ČR, nebo minimálně v Levelu, korupce není (kvůli vyjádření Martina Bacha nebo když si o tom povídají lidi v hPodu), ale v západním světě je tlak distributora velmi silný a může povznést konečné hodnocení.

Weby, které mají povoleno publikovat recenzi na očekávanou hru, většinou této hře dají vyšší hodnocení, než se později stane průměrem. U 30 her, které vyšly za poslední dva roky, jsem spočítal, jestli průměr prvních tří recenzí byl vyšší nebo nižší než průměr všech recenzí. Těch s vyšším počátečním hodnocením bylo přesně dvakrát více než těch s nižším iniciálním hodnocením. To nám říká, že weby s exkluzivitou dávají hře více než weby bez exkluzivity, takže náklonnost distributora má vliv na hodnocení. Může to ovšem také znamenat, že weby chtějí čtenáře zaujmout vysokým hodnocením. Prvních pár recenzí jsou pro hru nejpodstatnější, protože toto bývají ty nejčtenější recenze. Navíc prvních pár hodnocení mají na čtenáře největší vliv. Když vidím, že nějaká hra dostala 7 jakožto první recenzi, rovnou ji přestávám sledovat a recenzi si ani nepřečtu.

Další možný důvod je hype, který se u některých her uskutečňuje. Distributor kolem hry vytvoří hype marketingovou masáží, vysokými hodnoceními v oficiálních časopisech, správně zvolenými slovy v interview, dobře provedenou announcement show či podporou komunity kolem dané hry, což zahrnuje fanstránky, fóra, angažování se na populárních stránkách jako Facebook, YouTube či Twitter a různé události typu maraton v Dragon Age či fotbálek na počest launche FIFA 10. Velmi vysoké očekávání způsobí to, že hodnocení prakticky začíná na 8/10. S marketingem souvisí také to, že obzvlášť velké firmy se snaží získat přízeň recenzentů např. tím, že je zvou na večírky nebo že jim zasílají speciální sběratelské edice a různé postavičky, trička a další typy merchandise. Otázka je, jestli to dělají v lásce k recenzentovi nebo kvůli tomu, že se snaží pohnout s hodnocením.

Jaký vliv má Gamerankings a Metacritic na průměr hodnocení? Zaprvé recenze jsou seřazeny podle hodnocení, takže weby, které dané hře daly vysoké hodnocení, budou v seznamu výše než weby, od kterých dostala méně. Je samozřejmě větší šance, že čtenář klikne na první link, než že bude scrollovat dolů a klikat na nějaký spodnější. Další vliv průměrného hodnocení je to, že se tomu recenzenti povědomě přizpůsobují. Podle mě v dnešní době, kdy Metacritic má v herním průmyslu tak podstatný vliv, neexistuje recenzent, který by se před udělením finální známky nekoukl, kolik dostala od ostatních recenzentů. Další vliv je že člověk si radši přečte recenzi s hodnocením, které je co nejblíže průměrné hodnocení té hry, protože to vyjadřuje průměrný a většinový názor na hru. Já osobně si vždycky čtu průměrnou recenzi (což je většinou Gamespot nebo IGN). Tím, že recenzent nasměruje hodnocení více k průměru, si může zajistit více prokliků a tím pádem i nějaký ten bonus k platu.

Další věc jsou oficiální časopisy herních společností. Přiznám se, že nevím přesně, jak funguje vztah mezi redakcí a herní firmou, ale myslím si, že recenze v sobě moc objektivity nemají. Úspěch tohoto časopisu je přímo úměrný úspěchu dané konzole, proto je v zájmu redakce co nejvíce podpořit prodeje. Problém je v tom, že tohoto lze docílit třeba tím, že budete všem hrám dávat vyšší hodnocení, takže ve finále to bude vypadat tak, že vaše konzole má lepší hry než konkurenční systém. Pokud je hodnocení ovlivněno nějakými lidmi seshora, tedy samotnou herní firmou, pak by mohly naschvál dávat first-party hrám vyšší hodnocení než third-party, aby posílili vlastní prodeje.

To bylo pár důvodů, proč je praktický průměr teoretickým nadprůměrem. V tom případě jak může nastat situace, že nová hra dostane 75% a fóra jsou zaplněná nesouhlasnými pokřiky?

Výborných her je čím dál tím více, takže hráč může být vybíravý a hrát pouze ty nejlepší z nejlepších. Já jsem si teď spočítal průměrné hodnocení her, které jsem dohrál za posledních pár měsíců. Výsledek? 91,5%! Jakmile v Levelu nějaká hra dostane 7 nebo méně, jsem si skoro jist, že si ji nepořídím. Nestíhám hrát ani hry s hodnocením 9, tak proč bych se měl obtěžovat s tak podřadnými hry? Statistika nám říká, že každý měsíc vyjdou přibližně dvě hry, které dosáhnou průměrného hodnocení přes 90% a pod tuto hranici ten počet roste exponenciálně.

Další důvod je očekávání způsobené marketingem. Hra má takový hype, že lidi od ní neočekávají žádný průměr, ale výbornou hru s odpovídajícím hodnocením. Proto jsou lidi naštvaní, když hra dostane průměrnou známku. Já se přiznám, že jsem byl trochu zklamaný, když Dragon Age dostalo v Levelu 9/10. Přece jenom další hry co dostaly 10 byly Fallout 3, Mass Effect či Oblivion a myslím si, že Dragon Age se jim plně vyrovná. Kvůli těmto důvodům si myslím, že je zcela platný být zklamaný, že nějaká hra nesplnila očekávání, která si stanovila a tím pádem dostala průměrné či lehce nadprůměrné hodnocení.

Vliv na to také mohou mít různé způsoby hodnocení her. Zaprvé čím přesnější hodnocení, tím menší šance, že budou padat absolutní hodnocení. Média, která hodnotí na škále pěti budou hrám dávat ekvivalent 100% mnohem častěji než médium, které hodnotí v procentech. Za druhé čím méně přesné hodnocení, tím vyšší je procentuální ekvivalent nejnižšího bodu. Vzhledem k tomu, že v naprosté většině systémů nelze hře dát nulu, tak nejnižší hodnocení u škály z pěti bude 20%, zatímco u procentuální škály je to 1%. A za třetí bude také průměrná známka mít vyšší procentuální ekvivalent čím menší je škála. Na škále z pěti je průměr 3, což je 60%, na škále z deseti už je to 5,5 = 55% a na procentuální škále je to (1 + 100)/2 = 50,5%. Toto jsou všechno vlivy způsobu hodnocení, které zvyšují hodnocení her.

Měl by průměr tedy být 5,5/10? Odpověď by mohla být ano za předpokladu, že by časopis recenzovat všechny hry, i ty špatné, i ty dobré. Skutečnost je však jiná, např. více než jedna třetina všech Wii her má dvě a méně recenzí a to bývají zpravidla právě hry, u kterých jsou nízká očekávání. Stránky v tomto seznamu jsem zpracoval do grafu podle jejich průměrného hodnocení. Jak je vidět z lineární regrese, průměr hodnocení klesá čím více her to médium recenzovalo. Průměrné hodnocení nějakého časopisu či webu tedy záleží z velké části na tom, kolik her je celkově recenzováno. Pokud se všechna média budou snažit využívat celou škálu hodnocení, tedy mít vlastní průměr kolem 5,5, jednotlivá ohodnocení nepůjdou mezi sebou srovnávat, a tím pádem budou mít stránky typu databaze-her.cz, Gamerankings či Metacritic nulovou vypovídací hodnotu. Proto by každé médium a každý člověk (na dh) měl hodnotit stejným měřítkem i za cenu toho, že pak nevyužije celou dostupnou škálu.

Nejsem si jist, že jsem to dobře vysvětlil, proto radši uvedu příklad. Na dh hodnotí lidi hru X, která není nijak světoborná. Pepa hraje pouze ty nejlepší hry, proto u něj tato hra moc nezabodovala. Přesněji řečeno to u něj bude nejhorší hra, kterou kdy na dh hodnotil. Jestliže se bude snažit mít průměr 5,5, tak této hře dá 1 nebo 2. Honza hrál více her a tím pádem i více špatných her. U něj tato hra patří k průměru, proto hře dá 5,5. Potom hru hodnotí Level, který hodnotí obrovské množství her a tato hra od redaktora dostane 8/10. Tohle vše za předpokladu, že se hra líbila všem stejně. Jak je vidět, skóre je pouze ovlivněno počtem recenzí, který to médium či člověk recenzuje. Je to hodnocení, které je relativní k ostatním hodnocením daného média, takže samostatně nemá žádný význam. Aby měla dh smysl, musíme všichni hodnotit stejným měřítkem, nejjednodušší bude tedy škálou "velkých" časopisů a webů jako Level či Eurogamer.

Je mnoho faktorů, které zvyšují hodnocení her. Proto je také průměr hodnocení vyšší, než by ve skutečnosti měl být. První recenze jsou vysoká, protože recenzenti jsou u velkých titulů mnohdy ovlivněni hypem nebo v tom figuruje korupce, ať už v  klasickým médiu či v oficiálním časopisu. Další recenze jsou ovlivněny tímto průměrným skórem. Toto se děje pořád v jakémsi koloběhu, přičemž se pořád zvyšuje laťka průměru. V dnešním světě je perfektních her tolik, že hráč si může vybírat pouze ty nejlepší, proto je i lehký nadprůměr mnohými (třeba mnou) považovaný za podřadnou kategorii her. Všichni by měli hodnotit hru navzájem relativně, aby zprůměrovaná hodnocení měla nějaký smysl.

1 komentáře:

dteiml řekl(a)...

Přidal jsem odstavec, který začíná s Vliv na to také mohou mít... a předposlední odstavec, který začíná s Nejsem si jist...

Okomentovat