Su PokerNews.IT puoi giocare solo se hai almeno 18 anni. Il gioco può causare dipendenza. Gioca responsabilmente.

Agenzia delle Dogane e dei Monopoli Agenzia delle Dogane e dei Monopoli 18+

Polaris 2.0 Sconfigge il Team Stoxpoker nella Sfida Uomo-Macchina

3 min read
Polaris 2.0 Sconfigge il Team Stoxpoker nella Sfida Uomo-Macchina 0001

Dopo la sconfitta subita lo scorso anno nel primo campionato uomo-macchina, il gruppo di ricerca dell'università di Alberta si è impegnato per un anno al fine di mettere a punto la nuova versione di Polaris, il software in grado di giocare a poker. I loro sforzi sono stati ricompensati dato che Polaris 2.0 ha avuto la meglio sugli umani in una serie di partite di duplicate limit hold'em.

La gara si è disputata al Rio All-Suite Casino Hotel di Las Vegas, Nevada durante il Gaming Life Expo delle World Series of Poker, con una partita al giorno dal 3 al 6 luglio. La squadra che rappresentava gli umani era composta da più unità tutti parte del sito di poker Stoxpoker. A differenza dello scorso anno, quando gli umani erano rappresentati dai soli Phil Laak ed Ali Eslami, questa volta sono stati molto più numerosi i giocatori che hanno sfidato il software: Nick Grudzien, Kyle Hendon, Rich McRoberts, Victor Acosta, Mark Newhouse, IJay Palansky e Matt Hawrilenko.

Come già era stato lo scorso anno, la gara si è composta di quattro sessioni nelle quali gli umani simultaneamente e separatamente giocavano mani di "duplicate" limit Hold'em contro il computer, questa volta con bui a $500/$1'000 e limiti $1'000/$2'000. Stando alle regole del duplicate poker, le carte servite ai giocatori umani in una sessione erano identiche a quelle servite al computer in un'altra e vice-versa, con carte comuni identiche nelle due gare. Questo formato minimizza l'influenza della fortuna e pone condizioni di partenza identiche per Polaris 2.0 e per gli umani.

Alla fine di ogni gara, i totali di ognuna delle due partite giocate in simultanea (in sessioni da 500 mani) venivano confrontati per determinare il migliore. Si era deciso però che se i totali realizzati dai due team avessero presentato differenze inferiori a 25-small-bet (ovvero $25'000), la partita sarebbe stata dichiarata pari.

Nella prima partita, Nick Grudzien e Kyle Hendon hanno affrontato Polaris 2.0. Hendon ha concluso le 500 mani in vantaggio di $37'000, ma Grudzien nella stessa sessione ha finito sotto di $42'000. Differenza totale di $5'000 e gara dichiarata pari.

Gli umani si sono aggiudicati la seconda gara grazie principalmente agli sforzi di Rich McRoberts che ha finito in vantaggio di $89'500 contro il computer. Il suo partner, Victor Acosta, ha finito al contrario sotto di $39'500. Profitto netto per gli umani di $50'000 quindi più che sufficiente per dare loro la vittoria.

Polaris 2.0 ha recuperato vincendo sia il terzo sia il quarto incontro nonostante l'eccezionale prestazione di Mark Newhouse, nel terzo match, capace di chiudere in vantaggio di ben $251'500. Il suo compagno di squadra ha però concluso a meno $307'500. Vittoria per Polaris anche nel quinto ed ultimo incontro e gara decisa.

Nel complesso, pertanto, Polaris 2.0 ha vinto tre incontri, ne ha persi due e pareggiato uno. Stando a quanto riportato dal professor Michael Bowling, uno dei supervisori dell'università di Alberta, sono stati compiuti grandi progressi rispetto alla scorsa estate permettendo al computer di sfruttare meglio le debolezze degli avversari.

Cosa ancora più importante è stata che i programmatori sono stati in grado di aggiungere "un elemento di apprendimento che permette a Polaris di identificare le strategie adottate dagli umani e di variare la propria tattica di conseguenza." Questo significa che il computer non ha usato tattiche identiche contro tutti gli avversari ma ha seguito differenti schemi di gioco rendendo difficile agli umani variare il proprio di gioco, prendere note sull'atteggiamento del software o scambiarsi osservazioni tra una sessione e l'altra di gioco.

Polaris 2.0 era inoltre in grado di apprendere dai propri errori ricorrendo ad un algoritmo curiosamente chiamato "rammarico contro-fattuale" con il quale era in grado di tenere traccia delle giocate degli umani nelle mani in cui veniva sconfitto imparando come migliorarsi in situazioni analoghe.

Share this article

SCOPRI DI PIÙ

Altri Articoli