Cette nuit, Lee Sedol affrontera l'ordinateur de DeepMind au jeu de Go dans une première manche (sur cinq). Cette compétition sera retransmise en direct sur YouTube.
Cette nuit, à partir de 4h30 du matin, aura lieu la première manche d'une série de cinq matchs qui opposera Lee Sedol à AlphaGo. Le premier est l'un des meilleurs joueurs de Go au monde (si ce n'est le meilleur) qui est classé au plus haut niveau : 9-dan pro. Le second est une intelligence artificielle développée par DeepMind, une filiale de Google.
AlphaGo n'en est pas à son coup d'essai puisque l'ordinateur a battu le champion européen Fan Hui par 5 à 0 en 2015. Ce dernier n'est par contre classé « que » 2-dan pro. Lee Sedol était confiant et aurait déclaré qu'il pensait battre l'ordinateur par 5 à 0, ou au pire 4 à 1, mais il était moins agressif lors des dernières conférences expliquant qu'AlphaGo était visiblement « bien plus efficace » que ce qu'il pensait, comme le rapportent nos confrères de l'AFP.
Quoi qu'il en soit, si les règles du jeu de Go sont relativement simples, Demis Hassabis, cofondateur de DeepMind, explique qu'il s'agit « probablement du jeu le plus complexe inventé par l'Homme » et que « le nombre de combinaisons possibles est supérieur au nombre d'atomes dans l'Univers » indique Sciences et Avenir.
Bref, après les échecs, l'homme va de nouveau affronter la machine et tenter de sortir vainqueur. Le match sera a regarder via le flux suivant :
Commentaires (150)
#1
@Sébastien : on compte sur toi pour suivre le match et nous faire un résumé demain matin " />
#2
Intéressant. Pour le jeu d’échec, l’être humain est dépassé, pour le jeu de GO le résultat sera certainement le même. Rdv demain !
#3
Etant moi-même joueur de go amateur (je précise : pas à un haut niveau loin de là hein " /> ), j’ai hâte de voir ça (je suis l’actualité d’AlphaGo attentivement depuis quelques temps, et des IA joueuses de go en général)
Miam ! " />
#4
C’est énervant, ces histoires de “machines”, “ordinateurs” plus fort que…
En l’occurrence c’est bien le programme informatique développé par des chercheurs humains qui va se mesurer à un cerveau humain sugar powered.
D’après wikipedia deepblue son pendant pour les échecs “occupait la 259e place au TOP500 des supercalculateurs avec une puissance de calcul de 11,38 GFLOPS”.
Donc ok pour l’avancée programmatique qui me passe largement au-dessus, mais quid de la puissance du moteur ?
#5
#6
Pas sûr que je mette le réveil pour suivre le direct, par contre je veux bien savoir le résultat demain " />
#7
Celui qui m’a appris le jeu de Go avait insisté sur l’aspect visuel du jeu.
Je continue aujourd’hui de préférer les échecs, qui me conviennent mieux.
#8
La saison 4 de l’AVGN durant 5h, si je la commence à 23h30, elle devrait se finir à peu près à l’heure de cette passionnante partie. " />
#9
Forcément à un moment donné la machine à le dessus surtout qu’elle ne fait pas d’erreur si le programme n’en contient pas et ne fatigue pas.
Moi je suis battu depuis l’amstrad pc1512, il me battait à chaque fois aux échecs. :(
#10
#11
Pas forcement pour le jeu de go. Il y a en effet plus de combinaison que d’atome dans l’univers. L’ordinateur doit faire des hypothese pas toujours juste. A contrario pour les echecs je pense qu’il est possible de savoir qui va gagner uniquement en fonction de qui commence.
#12
Le nombre de coup aux échecs reste toujours trop important pour tout calculer. Il semblerait que le nombre de coups possibles soit de 10¹²⁰ pour les échecs.
Le go c’est 19×19. Bref, à la louche (19×19)!, soit ~1,4 × 10⁷⁶⁸, coups possibles pour une partie (sans compté les pierres mangées ce qui rend le chiffre encore plus grand). Pour le truc des atomes, l’univers observable c’est ~10⁸⁰.
#13
Pour moi y a aucune “intelligence” artificielle la dedans.
Juste un algo, pas fondamentalement compliqué, qui calcul des centaines de millions de combinaison et qui accumule de l’experience en priorisant les combinaisons qui l’ont mené a la victoire.
Si le champion perd pas aujourd’hui il perdra après demain, et alors ? juste le fruit d ordi de plus en plus puissant et d’algo qui aboutissent forcement a la meilleure solution si on a la puissance pour les calculer.
#14
Ça et sans doute une grosse base de données de parties enregistrées dans la bestiole (Deep learning comme disent les gens du market’ ? " />)
#15
Les échecs ne sont pas encore un jeu “résolu”, ce qui signifie qu’il n’existe pas de schéma type pour gagner (ou nul) à tous les coups ou savoir, quelque soit l’état d’une partie, quel est le meilleur coup possible.
Les jeux “résolus” restent pour l’heure assez simples : les allumettes, les tours de Hanoi, ou encore le morpion.
AlphaGo a quelque chose que les joueurs humains ne peuvent pas avoir : il a pu simuler un nombre remarquable de parties en peu de temps, et analyser sur chaque partie quels étaient les meilleurs coups à jouer. Quand on pense à Hikaru No Go, le manga de référence sur le go, le champion fantomatique Sai se montre invaincu parce qu’il a totalité une expérience en terme de durée et de parties qu’aucun humain ne possède.
C’est un peu ce bénéfice que possède ici AlphaGo ; Il a à la fois la possibilité d’apprendre de millions de parties humaines enregistrées, mais en plus simuler de nouvelles parties très rapidement pour analyser les résultats là où la même chose pour un humain prendrait des siècles. Cependant, si les humains peuvent encore résister à haut niveau à ces machines sans avoir ces avantages, c’est que les premières font peu preuve de créativité ou de prise de risque.
#16
Esperons que les humains gagnent celle la .. parceque les strategies de Go préenregistrés, associés au machine learning sauce google …
Il gagnera surement les premieres … mais 3⁄5 j’ai un doute quand meme !
#17
Oui je l’incluais dans l’expérience ^^ l’algo a surement été initialisé avec une tonne de match pro depuis des années.
#18
Pour AlphaGo, on est pourtant dans les vieilles recettes de la fin des années 80 sur les réseaux de neurones qui ne donnaient pas grand chose à l’époque et qui cartonnent maintenant justement grâce aux nouvelles possibilités aussi bien en capacité de calcul qu’en vitesse d’exécution. :chinoix:
#19
#20
#21
#22
#23
#24
#25
Et quand l’ordi joue on a droit à un spectacle de claquette ou a va être vraiement ennuyeux à mourir ? (deja que c’est purement cérébral…et qu’on meurt d’ennui aux échecs…)
#26
#27
Le gros avantage de l’ordinateur dans ces rencontres, c’est qu’il n’a pas besoin d’aller aux toilettes. Sauf bien sûr si c’est une machine de T’urines.
#28
#29
C’est vrai que vu le stress que peut apporter une partie d’échec de haut niveau et qu’une personne qui n’est pas en très bonne santé n’y résiste pas. : chinois:
#30
Oulah, oulah, tu confond quelque chose et dis quelque chose de fondamentalement faux :
Tu confond nombre d’atomes, et quantité de mémoire qu’il faudrait pour stocker ce nombre. Et par extension, tu confond également la mémoire qu’il faudrait pour stocker des possibilités.
Justement, c’est le rôle de l’algorithmie que de réduire la quantité de mémoire nécessaire a stocker ces possibilités : tu n’écris pas les possibilités de manière littérale (se qui n’aurait aucuns sens en matière informatique) mais de manière abstraite. C’est justement le principe a la base de la machine de Turing/ruban de möbius : tu peux théoriquement stocker des données a l’infini et revenir ou avancer sur chaque itération. C’est un des principes de l’intelligence artificielle.
De fait la comparaison et l’ordre de grandeur sont un peu mal foutus, il y a bien d’autre choses quantifiable/calculable qui dépassent le nombre d’atomes dans l’univers. (le nombre de décimales unique de PI par exemple)
#31
Attendez, je lance l’ O.S.T. d’Hikaru no Go
#32
Même pour les échecs, il est impossible pour un ordinateur de calculer toutes les combinaisons de coup possibles jusqu’à l’échec et mat. La technique était de calculer toutes les combinaisons des N prochains coup, et d’évaluer quelles combinaisons donnaient les meilleurs résultats.
Pour le go, cette technique ne marche pas car il est impossible d’évaluer si on est en train de gagner ou de perdre juste en regardant le plateau à un instant t. Tout peut se renverser en un seul coup.
La technique qui est utilisé pour le go est plutôt celle de Monte Carlo, qui consiste à évaluer au hasard certaines combinaisons de coup jusqu’à la fin de la partie, et de choisir parmi ces quelques combinaisons la meilleur possible. Même si ça semble très aléatoire, cette technique a donné des bons résultats.
DeepMind quant à lui ajoute à Monte Carlo l’utilisation de réseaux de neurones profonds, c’est-à-dire ce qu’on appelle de l’intelligence artificielle en informatique. Ces réseaux de neurones sont revenu à la mode ces dernières années grâce à l’arrivée de meilleurs ordinateurs, mais aussi de beaucoup plus de données facilement disponible grâce à Internet.
#33
La puissance oui, mais surtout le stockage !
Sans une base de données contenant des millions d’enregistrement propre (c’est a dire chaque exemple est annoté pour permettre l’apprentissage) et consultable avec un délai raisonnable, un algo même performant ne sert à rien.
Aujourd’hui ce n’est plus un frein, et même l’annotation peut être faite a grande échelle (cf les captcha google qui sont annoté par des humains a leur insu).
C’était inimaginable il y’a 20 ans, même avec la puissance de deep blue.
#34
… pour moi plutôt les recherches en IA et les avancés en prédiction de calcul (nos cpu en sont gavés)
Le jour ou on pourra manipuler les qbit : je pense que l’humanité sera en danger … d’extinction.
juste prévisible.
#35
… non, les réseaux neuronaux.
#36
A voir :
https://www.youtube.com/watch?v=0jh-jlWfKwo
Plus simple pour ceux qui veulent voir de l’ia :
https://www.youtube.com/watch?v=kHuIhhLPD2w
pour comprendre le début de notre fin ….
#37
http://blogs.wefrag.com/drak/2015/11/20/algorithme-genetique-exemple-2-voiture-2d-et-reseau-de-neurones/
#38
Et les réseaux de neurone existe depuis plus de 50 ans ;)
Les version multicouche depuis au moins une trentaine d’années.
Le deep learning n’est pas une nouveauté, c’est l’avènement de la combinaison puissance/données massive/algo optimisé.
#39
C’est un poil plus compliqué que ça. Pour deepblue et sa victoire aux échecs, il s’agissait essentiellement de faire du bruteforce, donc la puissance brute comptait plus que tout.
Ici, c’est un algo d’apprentissage, et c’est la phase d’apprentissage qui est déterminante que tout. La machine elle-même n’a pas nécessairement besoin d’être hyper puissante pour faire le calcul.
#40
L’algo lui-même est assez générique en fait, c’est ça la prouesse et c’est ça qui le rend “intelligent”. En gros il a été parametré pour apprendre à jouer au go, mais il pourrait être parametré pour d’autres tâches, comme le diagnostic médical.
C’est sa force comparé à un simple bruteforce qui n’est par définition applicable qu’à un problème donné.
#41
#42
“le nombre de combinaisons possibles est supérieur au nombre d’atomes dans l’Univers ” C’est pas un peu putassier ça? Je croyais que l’univers était infini ou tout du moins qu’on ne connaissait pas ces limites.
#43
Ça veut bien dire que c’est très grand! " />
#44
Je crois que c’est dans la tete au carré sur France Inter où un chercheur en IA disait que les progrès fait par AlphaGo dépassait toutes les previsions des specialistes. Ils pensaient qu’il ne pourrait battre un humain que dans 5 ans je crois.
Ca confirme le fait que le gars qui va jouer ce soir est un peu confiant que ce qu’il disait un peu auparavant.
Mais de ce que j’avais compris également c’est que le jeu de go n’a rien à voir avec les échecs et que justement une tactique bruteforce est totalement inutile ici car l’impredictabilité (j’aime pas les néologisme mais bon..) du jeu de go est beaucoup trop grande. Un joueur à qui il ne reste que quelques pierres n’est pas forcement un mauvaise posture.
#45
le libre arbitre
#46
Surtout que je crois avoir lu que la machine faisait des coups étonnants, risqués voire téméraires. Le fait qu’il y ait de la surprise me fascine. En gros, les programmeurs sont étonnés de ce que ça donne, ça fait froid dans le dos à certains, perso je trouve ça sympa.
Pour l’histoire de l’IA consciente qui pète la race humaine, je ne vois pas pourquoi ça plutôt qu’autre chose. Certes, ça pourrait tout changer, mais dans n’importe quel sens. Je crains beaucoup plus les humains que les machines, ils ont largement prouvé leur nocivité sur le monde.
#47
Le calcul quantique ne pourrait-il apporter un avantage concernant le GO ?
#48
#49
déjà 60 000 spectateurs " />
Edit: trompage dans les zéros " />
#50
C’est en ce moment !
Quelqu’un qui s’y connais en Go pourrai commenter ? " />
#51
#52
Les commentateurs sont géniaux, c’est une leçon de Go avec le match en tant qu’exemple concret.
#53
ça me rappelle Hunter x hunter 2011 avec komugi contre meruem " /> http://i.stack.imgur.com/cdCMD.jpg
#54
Et bien, il semblerait qu’AlphaGo vienne de gagner à l’instant.
#55
Alpha Go winner : W+Res ? kesako Res
#56
Resign
Abandon donc (la plupart des matchs de Go finisse par Resign, vu que les mecs savent quand ils n’ont plus aucunes chances de gagner)
#57
Merci pour l’info…
#58
#59
#60
Attention ici, voici l’histoire :
Il y a eu 2 rencontres IBM VS Kasparov, la première était DeepBlue contre Kasparov, la seconde était DeeperBlue contre Kasparov. DeepBlue s’est fait battre (premère archi BlueGene pour les deux, Deper étant une évolution avec plus d’ouvertures et plus de capacité de calcul), et n’était pas conçu pour battre le joueur. La seconde, DeeperBlue elle était spécifiquement faite pour battre le joueur.
#61
Je peux ressortir la polémique de l’époque sur Deeperblue ? " /> (comme quoi il n’aurait pas joué tout seul et qu’il a été démonté bien vite sans possibilité de revanche " /> )
#62
Doublon
#63
#64
Ce que cette théorie ne dit pas, c’est comment ils auraient trouvé un joueur humain capable de battre le meilleur joueur humain " />
#65
C’est faux, aucune ordinateur n’est capable d’analyser “tous les coups” pour aller à l’échec et mat… Le nombre de coups est exponentiel, totalement incalculable, et il serait ridicule de faire tous ces calculs vu que la très grande majorité des coups à jouer sont des coups stupides.
Les ordinateurs d’échec fonctionnent selon plusieurs méthodes :
- base de connaissance de partie. Notamment pour les ouvertures, les programmes contemporains contiennent tous une énorme base de données des grandes ouvertures classiques et des réponses à y apporter. Pareil pour les enchaînements techniques de mat de fin de partie (tour + roi vs roi…etc.)
- capacité d’analyse avec une profondeur de N : il s’agit d’analyser jusqu’à N coups successifs, sous forme de branche (chaque coup ouvrant la porte à une nouvelle version de la partie), afin de trouver des positions jugées comme étant “meilleures”
- capacité d’analyse de l’échiquier pour déterminer ce qu’est une position jugée “meilleure” : le mat est bien évidemment l’objectif premier, mais un gain de pièce, une défense de pièce, le contrôle du centre de l’échiquier ou bien juste une bonne diagonale d’un fou sont également des critères permettant d’associer un score à une succession de coups. La machine choisira le meilleur score.
#66
On a vérifié que c’était pas un Coréen mécanique comme il y a eu un Turc mécanique ?
#67
Raaaah il ne mettent même pas le score à la fin !! " />
#68
Alpha go a gagné par forfait, il n’y a donc pas de score pour la partie
Ca se joue en 5 manches, une par jour, donc il reste encore 2 manches pour retourner la situation
#69
Jour 1 : “bon je vais l’exploser ce petit ordinateur! 5-0 que je vais lui mettre”
Jour 2 à n : regarde l’ordinateur jouer
Jour n+1: “bon je vais sûrement gagner… enfin peut-être… je devrais… ”
Jour j , fin de première manche : “Bon je vais essayer de pas prendre un 5-0 dans les dents” " /> " />
#70
Pour ceux que ça intéresse, une explication relativement claire du principe de l’algorithme d’AlphaGo :https://www.youtube.com/watch?v=0OGj8-vEVU8
#71
#72
#73
Si le coréen perd, je propose de faire le match suivant contre Sarah Connor. On verra bien comment s’en sortira le programme " />
" />
#74
#75
#76
Merki, c’est fort intéressant.
#77
#78
Pas mal le pseudo, pendant un moment j’ai cru à un troll qui me répondait.
Oui, j’ai pas explicité plus mes propos, mais tu as étendu ma pensée.
Effectivement, ça ne fait que calculer, mais qui ne calcul pas en fin de compte?
Dans la finalité, ces algo apprennent à répondre de mieux en mieux à leur environnement.
J’ai toujours détesté les réseaux de neurones, alors que je suis ébahi face à ce qu’ils peuvent faire.
En revanche, j’ai toujours adoré les algo génétiques. Plus simple à coder je trouve…
#79
On trouve assez facilement des articles qui expliquent que AlphaGo tourne sur le cloud de Google, mais je n’ai trouvé aucune indication sur les ressources allouées.
Personne n’a remarqué de ralentissement chez Google entre 5h et 9h ce matin ? ;-)
#80
Lee Sedol a abandonné, ce qui est classique au Go. Le commentateur en anglais indiquait que ça se jouait à quelques points, mais qu’il avait du mal à compter sur le tableau utilisé pour la présentation.
Mon opinion perso est que c’est dommage de ne pas aller au bout de la partie, surtout si elle est serrée. C’est considéré comme tout à fait normal au go d’arrêter quand l’issue est certaine. Mais il s’agit ici de parties qui sont regardées par beaucoup de gens qui ne connaissent pas le jeu, et le fait de ne pas aller au bout rends le truc encore plus cryptique.
#81
#82
#83
Surtout qu’en général on parle implicitement de l’univers visible, donc un truc parfaitement limité
#84
#85
#86
Plus ou moins HS : C’est vraiment très intéressant (je ne connais pas trop ce domaine contrairement à beaucoup ici visiblement " />) mais tu as l’air de bien maîtriser le sujet, tu aurais des ressources (pour profane !) à conseiller ?
#87
" />
" />
#88
Lee Sedol a peut être juste évalué les coups de la machine pour voir sa façon de jouer, quitte à y laisser un match.Les 2 prochaines rencontres seront intéressantes je pense (et on sera fixé si la machine les gagne toutes).
#89
#90
En gros si, l’univers est limité puisqu’il a un âge (13.5 GA) et que la vitesse de la lumière est elle-même limitée…
Donc en caricaturant à l’extrême on pourrait dire que l’univers est “contenu” dans une sphère de 13.5 millards d’années-lumière de rayon…
#91
Lee Sedol, le champion coréen, est sorti des sentiers battus afin de tenter déstabiliser l’ordinateur
Tenter de prendre l’ascendant psychologique sur un ordinateur… mais bien sûr " />
#92
#93
L’univers observable est une sphère de 82 milliards d’années-lumières de diamètres.
#94
#95
Sébastien Gavois: c’est possible d’ARRETER de lire la conneries des atomes à chaque intervention sur la question ? laisse les autres journalistes le faire.C’est comme dire qu’a starcraft il y a 100 milliards de coup possible par action car on peut cliquer a chaque endroit de la map.
oui je peux jouer A1 tout le temps mais 355 fois sur 361 ca sert a rien !
#96
#97
#98
#99
#100
edit: foirage
#101
Le problème c’est quand tu joue contre un adversaire que tu n’as jamais vu jouer et qui connait toutes tes parties par coeur. Il faut bien tester un peu la réaction de l’adversaire.
#102
#103
#104
Le champion est inquiet :
“Aujourd’hui, je sais comment son algorithme a réussi à réduire le nombre de choix possibles. J’ai le sentiment qu’AlphaGo peut dans une certaine mesure imiter l’intuition humaine”“A présent, je crois que je ne pourrais peut-être pas vaincre AlphaGo avec une marge aussi importante que 5-0. Je dois être un peu plus stressé”.“Je pense que l’IA va à terme battre les humains au Go et qu’il s’agit de la conséquence inévitable du changement”, a ajouté le champion sud-coréen. “Mais les robots ne comprendront jamais la beauté du jeu comme nous, les humains, la comprenons”.
#105
C’est curieux que personne ici ne parle du cours de Yann LeCun au Collège de France, qui a pourtant été largement médiatisé lors de la conférence d’ouverture il y a quelques semaines, et qui est le père de l’apprentissage profond par convolution.
AlphaGo n’utilise pas exclusivement cette technique, mais le cour est intéressant car il est donné par une pointure mondiale sur le sujet, et parce que ça permet de bien situer ce qu’il est aujourd’hui capable d’attendre de la part de ces techniques. La labellisation automatique à la fin de la conférence d’ouverture est assez bluffante par sa précision (le tout en temps réel s’il vous plaît).
C’est dispo ici :http://www.college-de-france.fr/site/yann-lecun/course-2015-2016.htm
#106
AlphaGo n’utilise pas exclusivement cette technique, mais le cour est intéressant car il est donné par une pointure mondiale sur le sujet, et parce que ça permet de bien situer ce qu’il est aujourd’hui capable d’attendre de la part de ces techniques.
En shorter on peut imaginer quoi ? Les 50 prochaines années ?
#107
#108
#109
#110
#111
#112
#113
J’ai regadé le match cette nuit jusqu’à 8h30, le jeu était vraiment serré et d’après les commentateurs alphaGo était très agressif comparé aux dernières fois.
Je serai présent aux prochains matchs, c’est vraiment intéressant de voir un algo bien jouer " />
#114
En fait c’est beaucoup plus compliqué que ça.
L’algorithme possède deux réseaux neuronaux entrainnés (deep learning) avec un très grand nombre de partie déjà joué ce qui lui permet d’estimer la valeur d’un coup et le second lui permet de choisir la pertinence du coup.
Mais l’originalité car comme tu le dis , il ne peut pas estimer tous les coups possible. Il va donc les choisir au hasard. l’entrainement et le modèle d’apprentissage prend ensuite le relais en choisissant le bon coup à jouer.
Il faut une très grande puissance de calcul pour faire ça.
La grande différence est que la machine va jouer des millions de partie différente et trouver la bonne, l’humain non.
#115
#116
Concernant le Morpion, l’humain résiste : n’importe quel môme de 7 ans arrache le match nul à la machine.
#117
ah oui c’est juste je n’avais pas pris en compte l’expansion. Bref, c’est très grand, mais pas infini.
#118
#119
#120
C’est vrai qu’on ne trouve pas grand chose.
Perso j’ai fini par trouver ici :
AlphaGo Distributed, in its largest variant, used 280 GPUs and 1920 CPUs.
Evidemment, j’ai rien trouvé comme autre source, ni même concernant le match AlphaGo versus Fan Hui par exemple…
EDIT/ Contre Fan Hui, il y aurait eu 1 202 CPU et 176 GPU
#121
#122
Merci pour le lien : chinois: Ça me rappelle mes vieux cours de traitement du signal.
#123
Merci je recherchais justement quels livres pouvaient faire figure de référence de départ, et surtout en effet des videos de type université en ligne, je vais me pencher dessus " />
#124
2ème victoire à l’instant d’AlphaGo sur l’humain.
#125
pourquoi factorielle ?
Perso je calcule le nombre de combinaisons comme suit :
il y a 19 x 19 emplacements (soit 361), et 3 possibilités pour un emplacement : pierre blanche, pierre noire, pas de pierre.
Le nombre d’arrangement est donc : 3 puissance 361, soit 1,7 x 10 puissance 172
#126
Celle ci a été plus serrée (et plus longue à obtenir) mais oui : 2-0 pour alphago
#127
#128
#129
Tu calcules le nombre d’arrangement (état du Goban à un instant), mais pas le nombre de parties différentes possibles. J’ai trouvé ce papier qui fait un peu la différence entre les deux " />
Edit : Double grilled
#130
#131
Oui la brute force est même stupide, on arrive à de valeur totalement inatteignable, même pour les échecs, alors encore moins pour le go.
#132
J’aime noter la différence d’ordre de grandeur entre go et échecs. Aux échecs, tu peux construire un arbre des N prochains coups, c’est faisable (et fait) et dans cette optique, l’ordi a bruteforcé le jeu pour gagner à tous les coups contre l’humain.
Au go, c’est impossible, même pour les 3 prochains coups la combinatoire dépasse nos meilleurs calculateurs. Il faut obligatoirement trouver une nouvelle façon de faire que “juste” calculer (construire un arbre et le parcourir).
De toutes façon -l’équipe DeepMind le rappelle à chaque interview- quand on demande à un maitre de Go pourquoi il a joué tel coup, il n’y a pas de réponse rationnelle mais plutôt des truc du genre “j’ai senti qu’il fallait jouer là”.
Il n’y a pas d’algorithme (de méthode) pour bien jouer au Go, il faut avant tout s’imprégner des bons patterns, qui peuvent prendre des milliers de formes distinctes ayant chacune de nombreuses variations. Il me semble que l’humain accomplit ce travail avec une logique “irrationnelle” (je ne trouve pas de terme adéquat mais disons “non basée sur le calcul et la certitude”), on définit des concepts abstraits comme “zone d’influence”, “potentiel”, “initiative”, etc puis on fait une sorte de moyenne de tous ces indicateurs pour “sentir” le bon coup.
L’approche Deepmind a été exemplaire en la matière : c’est exactement ce qu’ils ont fait (et réussi : 2 victoires contre un 9 dan, moi je dis chapeau). Pour préciser ce qui a déjà été dit : il s’agit de 2 réseaux neuronaux en série. Le premier fait une “estimation de valeur” réduisant les coups possibles à un nombre raisonnable et le résultat passe dans le deuxième réseau qui fait une “estimation éthique” pour réduire encore ce nombre de coups.
Le travail de calibrage a donc consisté à lui faire ingurgiter des millions de parties pour déterminer le coup gagnant d’après telle configuration du goban.
Ca a l’air con maintenant que c’est fait mais rappelons-nous que c’était de la science fiction il y a tout juste quelques mois (voire semaines). Je m’enflamme mais on est à un moment charnière de l’IA, le Go devait être le dernier jeu de stratégie réfractaire à l’IA. Il nous a poussé à développer une techno très pointue, j’attends de voir ses futures applications, ça peut faire des merveilles.
#133
Si cela continue comme cela, il va falloir faire une nouvelle partie avec 9 points de handicap pour AlphaGo pour voir jusqu’où va la déculotée " />
#134
#135
Ca n’a rien d’étonnant , ils jouent des millions de partie de manière aléatoire puis les examine et trouve le meilleur choix avec son réseau de neurones entrainnés sur les parties types.
Il faut une sacrée puissance de calcul, c’est presque déséquilibré comme match en fait. Les champions humains faisant très peu d’erreur ont leur chance. Par contre un joueur lambda se fera pulvériser.
#136
La suite samedi matin à 4h30 pour ceux qui vont se poser la question demain matin. ;-)
#137
#138
#139
#140
Plus longue, oui, parce que Lee Sedol avait du mal a voir où AlphaGo l’emmenait, plus serrée, bof, vue le différentiel final d’environs 30 points, c’est l’équivalent d’un 6p face a un 9p, soit un gouffre.
#141
Bon bah, il semblerait qu’AlphaGo soit encore en train de démonter de l’humain pour la 3ème fois…
#142
Démontage terminé. 3-0 avec un score aux environs des 70-45 hors captures (le coin bas gauche semblait assez épique, mais finalement AlphaGo qu’on pensait avoir peur des échanges … A juste fait un truc du genre “fuck it, j’ai plus de coups d’avance que toi et une lecture propre du goban”.
Edit : j’attend la conférence de presse qui risque d’être “j’ai essayé mais il est vraiment trop fort”.
#143
Prochaine victime… " /> " /> Ah les égos des joueurs. " />
#144
A voir comment vont se dérouler les 2 dernières manches. Si y’a 5-0 avec des scores aussi fleuves que les matches 2 et 3 pour 4 et 5, soit Lee Sedol a un jeu qui n’est plus adapté aux ouvertures et lectures de ses concurrents (peu probable), soit va falloir penser a ouvrir des nouveaux niveaux (mais y’a quoi au dessus de 9p ?)
#145
#146
J’ai hate de voir un match du style au shogi la machine contre https://fr.wikipedia.org/wiki/Yoshiharu_Habu
#147
3-1 pour la machine, l’honneur est sauf.
#148
#149
Ils ne payent pas, puisqu’il fallait gagner 3 parties pour gagner 1M$ : Les pros bossent gratos ! :)
#150