[MàJ] Jeu de Go : l'intelligence artificielle AlphaGo remporte la première manche

[MàJ] Jeu de Go : l’intelligence artificielle AlphaGo remporte la première manche

Fight !

Avatar de l'auteur
Sébastien Gavois

Publié dans

Sciences et espace

09/03/2016 2 minutes
150

[MàJ] Jeu de Go : l'intelligence artificielle AlphaGo remporte la première manche

Cette nuit, Lee Sedol affrontera l'ordinateur de DeepMind au jeu de Go dans une première manche (sur cinq). Cette compétition sera retransmise en direct sur YouTube.

Cette nuit, à partir de 4h30 du matin, aura lieu la première manche d'une série de cinq matchs qui opposera Lee Sedol à AlphaGo. Le premier est l'un des meilleurs joueurs de Go au monde (si ce n'est le meilleur) qui est classé au plus haut niveau : 9-dan pro. Le second est une intelligence artificielle développée par DeepMind, une filiale de Google.

AlphaGo n'en est pas à son coup d'essai puisque l'ordinateur a battu le champion européen Fan Hui par 5 à 0 en 2015. Ce dernier n'est par contre classé « que » 2-dan pro. Lee Sedol était confiant et aurait déclaré qu'il pensait battre l'ordinateur par 5 à 0, ou au pire 4 à 1, mais il était moins agressif lors des dernières conférences expliquant qu'AlphaGo était visiblement « bien plus efficace » que ce qu'il pensait, comme le rapportent nos confrères de l'AFP.

Quoi qu'il en soit, si les règles du jeu de Go sont relativement simples, Demis Hassabis, cofondateur de DeepMind, explique qu'il s'agit « probablement du jeu le plus complexe inventé par l'Homme » et que « le nombre de combinaisons possibles est supérieur au nombre d'atomes dans l'Univers » indique Sciences et Avenir.

Bref, après les échecs, l'homme va de nouveau affronter la machine et tenter de sortir vainqueur. Le match sera a regarder via le flux suivant :

Écrit par Sébastien Gavois

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

next n'a pas de brief le week-end

Le Brief ne travaille pas le week-end.
C'est dur, mais c'est comme ça.
Allez donc dans une forêt lointaine,
Éloignez-vous de ce clavier pour une fois !

Fermer

Commentaires (150)


&nbsp;@Sébastien : on compte sur toi pour suivre le match et nous faire un résumé demain matin <img data-src=" />


Intéressant. Pour le jeu d’échec, l’être humain est dépassé, pour le jeu de GO le résultat sera certainement le même. Rdv demain !


Etant moi-même joueur de go amateur (je précise : pas à un haut niveau loin de là hein <img data-src=" /> ), j’ai hâte de voir ça (je suis l’actualité d’AlphaGo attentivement depuis quelques temps, et des IA joueuses de go en général)

Miam ! <img data-src=" />


C’est énervant, ces histoires de “machines”, “ordinateurs” plus fort que…

En l’occurrence c’est bien le programme informatique développé par des chercheurs humains qui va se mesurer à un cerveau humain sugar powered.



D’après wikipedia deepblue son pendant pour les échecs&nbsp; “occupait la 259e place au TOP500 des supercalculateurs avec une puissance de calcul de 11,38&nbsp;GFLOPS”.



Donc ok pour l’avancée programmatique qui me passe largement au-dessus, mais quid de la puissance du moteur ?








gragra a écrit :



C’est énervant, ces histoires de “machines”, “ordinateurs” plus fort que…

En l’occurrence c’est bien le programme informatique développé par des chercheurs humains qui va se mesurer à un cerveau humain sugar powered.



D’après wikipedia deepblue son pendant pour les échecs  “occupait la 259e place au TOP500 des supercalculateurs avec une puissance de calcul de 11,38 GFLOPS”.



Donc ok pour l’avancée programmatique qui me passe largement au-dessus, mais quid de la puissance du moteur ?







Un bon V8 HEMI 426 ? <img data-src=" />



Pas sûr que je mette le réveil pour suivre le direct, par contre je veux bien savoir le résultat demain <img data-src=" />


Celui qui m’a appris le jeu de Go avait insisté sur l’aspect visuel du jeu.

Je continue aujourd’hui de préférer les échecs, qui me conviennent mieux.


La saison 4 de l’AVGN durant 5h, si je la commence à 23h30, elle devrait se finir à peu près à l’heure de cette passionnante partie. <img data-src=" />


Forcément à un moment donné la machine à le dessus surtout qu’elle ne fait pas d’erreur si le programme n’en contient pas et ne fatigue pas.



Moi je suis battu depuis l’amstrad pc1512, il me battait à chaque fois aux échecs. :(








metaphore54 a écrit :



Forcément à un moment donné la machine à le dessus surtout qu’elle ne fait pas d’erreur si le programme n’en contient pas et ne fatigue pas.



Moi je suis battu depuis l’amstrad pc1512, il me battait à chaque fois aux échecs. :(





C’est surtout que les progrès dans les langages de programmation, les programmes eux mêmes font que c’est vain.



La puissance brute n’est pas vraiment, pour moi, une variable intéressante. Depuis qu’on fait de la virtualisation et autre moyens de diviser la charge, la puissance est virtuellement illimitée.



Le plus intéressant, c’est la rapidité et la précision d’exécution.



Pas forcement pour le jeu de go. Il y a en effet plus de combinaison que d’atome dans l’univers. L’ordinateur doit faire des hypothese pas toujours juste. A contrario pour les echecs je pense qu’il est possible de savoir qui va gagner uniquement en fonction de qui commence.


Le nombre de coup aux échecs reste toujours trop important pour tout calculer. Il semblerait que le nombre de coups possibles soit de 10¹²⁰ pour les échecs.



Le go c’est 19×19. Bref, à la louche (19×19)!, soit ~1,4 × 10⁷⁶⁸, coups possibles pour une partie (sans compté les pierres mangées ce qui rend le chiffre encore plus grand). Pour le truc des atomes, l’univers observable c’est ~10⁸⁰.


Pour moi y a aucune “intelligence” artificielle la dedans.



Juste un algo, pas fondamentalement compliqué, qui calcul des centaines de millions de combinaison et qui accumule de l’experience en priorisant les combinaisons qui l’ont mené a la victoire.



Si le champion perd pas aujourd’hui il perdra après demain, et alors ? juste le fruit d ordi de plus en plus puissant et d’algo qui aboutissent forcement a la meilleure solution si on a la puissance pour les calculer.


Ça et sans doute une grosse base de données de parties enregistrées dans la bestiole (Deep learning comme disent les gens du market’ ? <img data-src=" />)


Les échecs ne sont pas encore un jeu “résolu”, ce qui signifie qu’il n’existe pas de schéma type pour gagner (ou nul) à tous les coups ou savoir, quelque soit l’état d’une partie, quel est le meilleur coup possible.

Les jeux “résolus” restent pour l’heure assez simples : les allumettes, les tours de Hanoi, ou encore le morpion.



AlphaGo a quelque chose que les joueurs humains ne peuvent pas avoir : il a pu simuler un nombre remarquable de parties en peu de temps, et analyser sur chaque partie quels étaient les meilleurs coups à jouer. Quand on pense à Hikaru No Go, le manga de référence sur le go, le champion fantomatique Sai se montre invaincu parce qu’il a totalité une expérience en terme de durée et de parties qu’aucun humain ne possède.

&nbsp;

&nbsp;C’est un peu ce bénéfice que possède ici AlphaGo ; Il a à la fois la possibilité d’apprendre de millions de parties humaines enregistrées, mais en plus simuler de nouvelles parties très rapidement pour analyser les résultats là où la même chose pour un humain prendrait des siècles. Cependant, si les humains peuvent encore résister à haut niveau à ces machines sans avoir ces avantages, c’est que les premières font peu preuve de créativité ou de prise de risque.


Esperons que les humains gagnent celle la .. parceque les strategies de Go préenregistrés, associés au machine learning sauce google …

Il gagnera surement les premieres … mais 35 j’ai un doute quand meme !


Oui je l’incluais dans l’expérience ^^ l’algo a surement été initialisé avec une tonne de match pro depuis des années.


Pour AlphaGo, on est pourtant dans les vieilles recettes de la fin des années 80 sur les réseaux de neurones qui ne donnaient pas grand chose à l’époque et qui cartonnent maintenant justement grâce aux nouvelles possibilités aussi bien en capacité de calcul qu’en vitesse d’exécution. :chinoix:








Meowcate a écrit :



Les échecs ne sont pas encore un jeu “résolu”, ce qui signifie qu’il n’existe pas de schéma type pour gagner (ou nul) à tous les coups ou savoir, quelque soit l’état d’une partie, quel est le meilleur coup possible.



Les jeux "résolus" restent pour l'heure assez simples : les allumettes, les tours de Hanoi, ou encore le morpion.











Le texas hold’em (http://science.sciencemag.org/content/347/6218/145)&nbsp;et les dames aussi il me semble &nbsp;(http://science.sciencemag.org/content/317/5844/1518.abstract)









linkin623 a écrit :



C’est surtout que les progrès dans les langages de programmation, les programmes eux mêmes font que c’est vain.



La puissance brute n’est pas vraiment, pour moi, une variable intéressante. Depuis qu’on fait de la virtualisation et autre moyens de diviser la charge, la puissance est virtuellement illimitée.



Le plus intéressant, c’est la rapidité et la précision d’exécution.







Pour le jeu d’échec c’était effectivement une stratégie de « force brute » qu’utilisait l’ordinateur : il calculait tous les coups possibles et leurs conséquences à l’avance, et choisissait le chemin qui lui donnait un avantage. Avec l’augmentation de la puissance de calcul et des capacités mémoires des ordinateurs, on a fini par avoir des ordinateurs capables de calculer tous les chemins jusqu’à l’échec et mat.



Pour le jeu de Go une telle stratégie est vouée à l’échec, car les possibilités sont des ordres de fois plus énormes, de l’ordre du nombre d’atomes dans l’Univers comme l’explique la news… Aucun ordinateur ne pourra jamais calculer toutes ces possibilités (littéralement jamais, puisqu’il faudrait tous les atomes de l’Univers pour enregistrer les données…). C’est donc un algorithme un peu plus intelligent que ça qui est aux commandes. D’après ce que j’ai compris l’algo calcule une espèce de « valeur » pour chaque emplacement, basée sur son environnement (s’il y a un pion à côté, deux, des pions ennemis…). Il choisit ensuite une valeur parmi les plus hautes. Du coup, contrairement au jeu d’échecs, l’ordinateur n’a pas toutes les possibilités en mémoire, et ne peut pas être sûr de gagner à 100% tant que la partie n’est pas quasiment finie.



Pour en savoir plus









Meowcate a écrit :



Les échecs ne sont pas encore un jeu “résolu”, ce qui signifie qu’il n’existe pas de schéma type pour gagner (ou nul) à tous les coups ou savoir, quelque soit l’état d’une partie, quel est le meilleur coup possible.

Les jeux “résolus” restent pour l’heure assez simples : les allumettes, les tours de Hanoi, ou encore le morpion.









J’ai passé énormément de temps sur une variante du morpion (c’était sur Mac SE).

La grille de jeu était&nbsp; gigantesque et il fallait aligner 5 croix ou ronds.

Heureusement ce Mac est à 300 bornes d’ici, sinon je serais rescotché dessus.









Cashalow a écrit :



Le texas hold’em (http://science.sciencemag.org/content/347/6218/145) et les dames aussi il me semble  (http://science.sciencemag.org/content/317/5844/1518.abstract)





Les dames, oui. Par contre pour le poker, il s’agit d’une version simplifié du jeu qui a été résolue (il y avait un article dans un ‘pour la science’ de l’année passée de mémoire)









zefling a écrit :



Le nombre de coup aux échecs reste toujours trop important pour tout calculer. Il semblerait que le nombre de coups possibles soit de 10¹²⁰ pour les échecs.



Le go c’est 19×19. Bref, à la louche (19×19)!, soit ~1,4 × 10⁷⁶⁸, coups possibles pour une partie (sans compté les pierres mangées ce qui rend le chiffre encore plus grand). Pour le truc des atomes, l’univers observable c’est ~10⁸⁰.







Merci pour ces ordres de grandeur <img data-src=" />







coolraoul a écrit :



Pour moi y a aucune “intelligence” artificielle la dedans.



Juste un algo, pas fondamentalement compliqué, qui calcul des centaines de millions de combinaison et qui accumule de l’experience en priorisant les combinaisons qui l’ont mené a la victoire.



Si le champion perd pas aujourd’hui il perdra après demain, et alors ? juste le fruit d ordi de plus en plus puissant et d’algo qui aboutissent forcement a la meilleure solution si on a la puissance pour les calculer.







Justement non, ce n’est pas un bête algo de type « brute force » qui calcule toutes les possibilités, l’algo est bien plus subtil que ça. Et bien plus efficace aussi puisque justement, il n’a pas à calculer toutes les possibilités.



Il y a donc bel et bien l’intelligence que les humains ont mis dans l’algorithme. C’est une forme d’intelligence artificielle.









linkin623 a écrit :



La puissance brute n’est pas vraiment, pour moi, une variable intéressante. Depuis qu’on fait de la virtualisation et autre moyens de diviser la charge, la puissance est virtuellement illimitée.



Le plus intéressant, c’est la rapidité et la précision d’exécution.





La puissance, le nombre d’opérations réalisables par unité de temps,&nbsp; ne t’intéresse pas mais elle est quand même importante dans la rapidité d’exécution que tu trouves intéressante. C’est paradoxal.



Et quand l’ordi joue on a droit à un spectacle de claquette ou a va être vraiement ennuyeux à mourir ? (deja que c’est purement cérébral…et qu’on meurt d’ennui aux échecs…)








coolraoul a écrit :



Pour moi y a aucune “intelligence” artificielle la dedans.



Juste un algo, pas fondamentalement compliqué, qui calcul des centaines de millions de combinaison et qui accumule de l’experience en priorisant les combinaisons qui l’ont mené a la victoire.



Si le champion perd pas aujourd’hui il perdra après demain, et alors ? juste le fruit d ordi de plus en plus puissant et d’algo qui aboutissent forcement a la meilleure solution si on a la puissance pour les calculer.





A ceci je te pose la question qu’est ce qu’une “intelligence” ?



Le gros avantage de l’ordinateur dans ces rencontres, c’est qu’il n’a pas besoin d’aller aux toilettes. Sauf bien sûr si c’est une machine de T’urines.








Meowcate a écrit :



Les jeux “résolus” restent pour l’heure assez simples : les allumettes, les tours de Hanoi, ou encore le morpion.







Les dames aussi sont résolues.



C’est vrai que vu le stress que peut apporter une partie d’échec de haut niveau et qu’une personne qui n’est pas en très bonne santé n’y résiste pas. : chinois:


Oulah, oulah, tu confond quelque chose et dis quelque chose de fondamentalement faux :&nbsp;

Tu confond nombre d’atomes, et quantité de mémoire qu’il faudrait pour stocker ce nombre. Et par extension, tu confond également la mémoire qu’il faudrait pour stocker des possibilités.

Justement, c’est le rôle de l’algorithmie que de réduire la quantité de mémoire nécessaire a stocker ces possibilités : tu n’écris pas les possibilités de manière littérale (se qui n’aurait aucuns sens en matière informatique) mais de manière abstraite. C’est justement le principe a la base de la machine de Turing/ruban de möbius : tu peux théoriquement stocker des données a l’infini et revenir ou avancer sur chaque itération. C’est un des principes de l’intelligence artificielle.

De fait la comparaison et l’ordre de grandeur sont un peu mal foutus, il y a bien d’autre choses quantifiable/calculable qui dépassent le nombre d’atomes dans l’univers. (le nombre de décimales unique de PI par exemple)


Attendez, je lance l’ O.S.T.&nbsp; d’Hikaru no Go


Même pour les échecs, il est impossible pour un ordinateur de calculer toutes les combinaisons de coup possibles jusqu’à l’échec et mat. La technique était de calculer toutes les combinaisons des N prochains coup, et d’évaluer quelles combinaisons donnaient les meilleurs résultats.

&nbsp;

Pour le go, cette technique ne marche pas car il est impossible d’évaluer si on est en train de gagner ou de perdre juste en regardant le plateau à un instant t. Tout peut se renverser en un seul coup.

La technique qui est utilisé pour le go est plutôt celle de Monte Carlo, qui consiste à évaluer au hasard certaines combinaisons de coup jusqu’à la fin de la partie, et de choisir parmi ces quelques combinaisons la meilleur possible. Même si ça semble très aléatoire, cette technique a donné des bons résultats.



DeepMind quant à lui ajoute à Monte Carlo l’utilisation de réseaux de neurones profonds, c’est-à-dire ce qu’on appelle de l’intelligence artificielle en informatique. Ces réseaux de neurones sont revenu à la mode ces dernières années grâce à l’arrivée de meilleurs ordinateurs, mais aussi de beaucoup plus de données facilement disponible grâce à Internet.


La puissance oui, mais surtout le stockage !

Sans une base de données contenant des millions d’enregistrement propre (c’est a dire chaque exemple est annoté pour permettre l’apprentissage) et consultable avec un délai raisonnable, un algo même performant ne sert à rien.

Aujourd’hui ce n’est plus un frein, et même l’annotation peut être faite a grande échelle (cf les captcha google qui sont annoté par des humains a leur insu).

C’était inimaginable il y’a 20 ans, même avec la puissance de deep blue.

&nbsp;&nbsp;


… pour moi plutôt les recherches en IA et les avancés en prédiction de calcul (nos cpu en sont gavés)

Le jour ou on pourra manipuler les qbit : je pense que l’humanité sera en danger … d’extinction.



juste prévisible.


… non, les réseaux neuronaux.


A voir :

https://www.youtube.com/watch?v=0jh-jlWfKwo

Plus simple pour ceux qui veulent voir de l’ia :

https://www.youtube.com/watch?v=kHuIhhLPD2w



pour comprendre le début de notre fin ….


Et les réseaux de neurone existe depuis plus de 50 ans ;)&nbsp;

Les version multicouche depuis au moins une trentaine d’années.

Le deep learning n’est pas une nouveauté, c’est l’avènement de la combinaison puissance/données massive/algo optimisé.


C’est un poil plus compliqué que ça. Pour deepblue et sa victoire aux échecs, il s’agissait essentiellement de faire du bruteforce, donc la puissance brute comptait plus que tout.



Ici, c’est un algo d’apprentissage, et c’est la phase d’apprentissage qui est déterminante que tout. La machine elle-même n’a pas nécessairement besoin d’être hyper puissante pour faire le calcul.


L’algo lui-même est assez générique en fait, c’est ça la prouesse et c’est ça qui le rend “intelligent”. En gros il a été parametré pour apprendre à jouer au go, mais il pourrait être parametré pour d’autres tâches, comme le diagnostic médical.



C’est sa force comparé à un simple bruteforce qui n’est par définition applicable qu’à un problème donné.








ledufakademy a écrit :



http://blogs.wefrag.com/drak/2015/11/20/algorithme-genetique-exemple-2-voiture-2d-et-reseau-de-neurones/





Ici le réseau de neurone ne fait pas d’apprentissage il est seulement utiliser pour piloter la voiture. c’est l’algorithme génétique qui se charge de trouver les meilleurs paramètres. L’algo génétique est une technique exploratoire, ça reste un brute force mais guidé dans la bonne direction.



“le nombre de combinaisons possibles est supérieur au nombre d’atomes dans l’Univers&nbsp;” C’est pas un peu putassier ça? Je croyais que l’univers était infini ou tout du moins qu’on ne connaissait pas ces limites.


&nbsp; Ça veut bien dire que c’est très grand! <img data-src=" />


Je crois que c’est dans la tete au carré sur France Inter où un chercheur en IA disait que les progrès fait par AlphaGo dépassait toutes les previsions des specialistes. Ils pensaient qu’il ne pourrait battre un humain que dans 5 ans je crois.



Ca confirme le fait que le gars qui va jouer ce soir est un peu confiant que ce qu’il disait un peu auparavant.



Mais de ce que j’avais compris également c’est que le jeu de go n’a rien à voir avec les échecs et que justement une tactique bruteforce est totalement inutile ici car l’impredictabilité (j’aime pas les néologisme mais bon..) du jeu de go est beaucoup trop grande. Un joueur à qui il ne reste que quelques pierres n’est pas forcement un mauvaise posture.


le libre arbitre


Surtout que je crois avoir lu que la machine faisait des coups étonnants, risqués voire téméraires. Le fait qu’il y ait de la surprise me fascine. En gros, les programmeurs sont étonnés de ce que ça donne, ça fait froid dans le dos à certains, perso je trouve ça sympa.

Pour l’histoire de l’IA consciente qui pète la race humaine, je ne vois pas pourquoi ça plutôt qu’autre chose. Certes, ça pourrait tout changer, mais dans n’importe quel sens. Je crains beaucoup plus les humains que les machines, ils ont largement prouvé leur nocivité sur le monde.


Le calcul quantique ne pourrait-il apporter un avantage concernant le GO ?








fusion_sadam a écrit :



Ici le réseau de neurone ne fait pas d’apprentissage il est seulement utiliser pour piloter la voiture. c’est l’algorithme génétique qui se charge de trouver les meilleurs paramètres. L’algo génétique est une technique exploratoire, ça reste un brute force mais guidé dans la bonne direction.





Sans vouloir t’offenser, tu parles de 2 algorithmes bien différents.

Un réseau de neurones apprend, c’est bien sa fonction primaire.

Quand il a fini d’apprendre ou quand l’utilisateur considère qu’il a fini d’apprendre, il peut commencer à l’utiliser.

Si ça ne marche pas, il peut relancer l’apprentissage de réseau jusqu’à que les neurones soient bien pondérés, et recommencer le tout au besoin.



L’algorithme génétique apprend aussi, mais de manière plus aléatoire.



A noter que les 2 algorithmes peuvent très bien se viander. L’algorithme génétique devrait techniquement tendre vers le meilleur, mais ça arrive qu’il croit à quelque chose d’erroné.



déjà 60 000 spectateurs <img data-src=" />



Edit: trompage dans les zéros&nbsp;<img data-src=" />


C’est en ce moment !

Quelqu’un qui s’y connais en Go pourrai commenter ? <img data-src=" />








coolraoul a écrit :



le libre arbitre






Ah, la douce illusion :)     



En tout cas c’est mon opinion, personellement je crois fermement au déterminisme de l’univers, et que par conséquent nous n’avons que l’illusion du choix, si l’on considère que toutes nos pensées ne sont que le résultat de flux electriques sautant de neurones en neurones dans notre cerveau…



Comme AlphaGo s’appuie massivement sur un réseau de neurones, il répond pour moi à une plasticité similaire au cerveau humain (capacité d’apprentissage et de prédiction suite à la répétition d’expériences), et se qualifie donc tout à fait en tant qu’IA.



Les commentateurs sont géniaux, c’est une leçon de Go avec le match en tant qu’exemple concret.


ça me rappelle Hunter x hunter 2011 avec komugi contre meruem&nbsp;<img data-src=" />&nbsphttp://i.stack.imgur.com/cdCMD.jpg


Et bien, il semblerait qu’AlphaGo vienne de gagner à l’instant.


Alpha Go winner : W+Res ? kesako Res


Resign

Abandon donc (la plupart des matchs de Go finisse par Resign, vu que les mecs savent quand ils n’ont plus aucunes chances de gagner)


Merci pour l’info…&nbsp;








Konrad a écrit :



Pour le jeu d’échec c’était effectivement une stratégie de « force brute » qu’utilisait l’ordinateur



Pour en savoir plus





Deep Blue était surtout programmé pour battre Kasparov. Je reste persuadé que d’autres joueurs d’échec de classe internationale aurait battu Deep Blue.









Mikilo a écrit :



Sans vouloir t’offenser, tu parles de 2 algorithmes bien différents.

Un réseau de neurones apprend, c’est bien sa fonction primaire.

Quand il a fini d’apprendre ou quand l’utilisateur considère qu’il a fini d’apprendre, il peut commencer à l’utiliser.

Si ça ne marche pas, il peut relancer l’apprentissage de réseau jusqu’à que les neurones soient bien pondérés, et recommencer le tout au besoin.



L’algorithme génétique apprend aussi, mais de manière plus aléatoire.



A noter que les 2 algorithmes peuvent très bien se viander. L’algorithme génétique devrait techniquement tendre vers le meilleur, mais ça arrive qu’il croit à quelque chose d’erroné.





Heuuuu… Non, la fonction du réseau de neurones proprement dit n’est pas d’apprendre, juste de calculer.



Un réseau de neurones, c’est un assemblage de calculateurs élémentaires appelés neurones, qui font un calcul relativement simple (pondérer leurs entrées) pour calculer une valeur de sortie, qui sert potentiellement d’entrée à un ou plusieurs autres neurones, via des interconnexions. Un réseau de neurones ne peut rien faire si les neurones individuels ne font pas la bonne pondération ou ne sont pas correctement interconnectés entre eux. La puissance du réseau vient du fait que chaque neurone fait son calcul dans son coin, indépendemment des autres, on a donc un calcul massivement parallèle.



Le boulot de déterminer les pondérations et les interconnexions est dévolu à un algorithme d’apprentissage. L’algorithme génétique est une méthode d’apprentissage, il en existe d’autres (back-propagation, unsupervised learning, tout ça).



Il est possible d’utiliser plusieurs algorithmes d’apprentissage différents à un même réseau, sous réserve bien sûr qu’un algorithme ne bousille pas les prérequis d’un autre.



Une fois que l’apprentissage est terminé, le réseau de neurones est autonome et n’a plus besoin d’être modifié (il pourrait très bien être gravé dans une puce genre ASIC), bien qu’il existe de nombreux cas où l’algorithme d’apprentissage est ré-appliqué sur un réseau déjà déployé (adaptativité aux conditions changeantes…).



Attention ici, voici l’histoire :

Il y a eu 2 rencontres IBM VS Kasparov, la première était DeepBlue contre Kasparov, la seconde était DeeperBlue contre Kasparov. DeepBlue s’est fait battre (premère archi BlueGene pour les deux, Deper étant une évolution avec plus d’ouvertures et plus de capacité de calcul), et n’était pas conçu pour battre le joueur. La seconde, DeeperBlue elle était spécifiquement faite pour battre le joueur.


Je peux ressortir la polémique de l’époque sur Deeperblue ? <img data-src=" /> (comme quoi il n’aurait pas joué tout seul et qu’il a été démonté bien vite sans possibilité de revanche <img data-src=" /> )


Doublon








coolraoul a écrit :



le libre arbitre





Le libre arbitre ? dans un cerveau qui n’est que réaction chimique et physique. Tout au plus, un touche d’aléatoire en plus dans un univers chaotique. Le libre arbitre existe-t-il vraiment ?

Considéré ne pas avoir de libre arbitre nous est très dérangeant à plusieurs niveaux, aussi bien pour l’égo, mais le libre arbitre nous est nécessaire pour pouvoir juger par exemple, sans libre arbitre, nous ne pouvons plus être coupable de nos actions.



Ce que cette théorie ne dit pas, c’est comment ils auraient trouvé un joueur humain capable de battre le meilleur joueur humain&nbsp;<img data-src=" />


C’est faux, aucune ordinateur n’est capable d’analyser “tous les coups” pour aller à l’échec et mat… Le nombre de coups est exponentiel, totalement incalculable, et il serait ridicule de faire tous ces calculs vu que la très grande majorité des coups à jouer sont des coups stupides.



Les ordinateurs d’échec fonctionnent selon plusieurs méthodes :



&nbsp;- base de connaissance de partie. Notamment pour les ouvertures, les programmes contemporains contiennent tous une énorme base de données des grandes ouvertures classiques et des réponses à y apporter. Pareil pour les enchaînements techniques de mat de fin de partie (tour + roi vs roi…etc.)



&nbsp;- capacité d’analyse avec une profondeur de N : il s’agit d’analyser jusqu’à N coups successifs, sous forme de branche (chaque coup ouvrant la porte à une nouvelle version de la partie), afin de trouver des positions jugées comme étant “meilleures”



&nbsp;- capacité d’analyse de l’échiquier pour déterminer ce qu’est une position jugée “meilleure” : le mat est bien évidemment l’objectif premier, mais un gain de pièce, une défense de pièce, le contrôle du centre de l’échiquier ou bien juste une bonne diagonale d’un fou sont également des critères permettant d’associer un score à une succession de coups. La machine choisira le meilleur score.


On a vérifié que c’était pas un Coréen mécanique comme il y a eu un Turc mécanique ?


Raaaah il ne mettent même pas le score à la fin !!&nbsp;<img data-src=" />


Alpha go a gagné par forfait, il n’y a donc pas de score pour la partie



Ca se joue en 5 manches, une par jour, donc il reste encore 2 manches pour retourner la situation


Jour 1 : “bon je vais l’exploser ce petit ordinateur! 5-0 que je vais lui mettre”

Jour 2 à n : regarde l’ordinateur jouer

Jour n+1: “bon je vais sûrement gagner… enfin peut-être… je devrais… ”

Jour j , fin de première manche : “Bon je vais essayer de pas prendre un 5-0 dans les dents” <img data-src=" /> <img data-src=" />


Pour ceux que ça intéresse, une explication relativement claire du principe de l’algorithme d’AlphaGo :https://www.youtube.com/watch?v=0OGj8-vEVU8








divide a écrit :



Ce que cette théorie ne dit pas, c’est comment ils auraient trouvé un joueur humain capable de battre le meilleur joueur humain&nbsp;<img data-src=" />





J’ai peu de problèmes à imaginer qu’une équipe composée d’un (voire plusieurs) joueur humain qui élabore une stratégie à long terme et d’un ordinateur qui calcule les combinaisons pour détecter les failles&nbsp;tactiques&nbsp;joue significativement mieux que l’un ou l’autre individuellement…

&nbsp;









33A20158-2813-4F0D-9D4A-FD05E2C42E48 a écrit :



J’ai peu de problèmes à imaginer qu’une équipe composée d’un (voire plusieurs) joueur humain qui élabore une stratégie à long terme et d’un ordinateur qui calcule les combinaisons pour détecter les failles tactiques joue significativement mieux que l’un ou l’autre individuellement…





J’ai du mal à me dire que plusieurs joueurs pro d’echec (avec leur Ego) arrivent a se mètrent d’accord entre eux aussi vite qu’un joueur seul (qui plus est, le meilleur )…



Si le coréen perd, je propose de faire le match suivant contre Sarah Connor. On verra bien comment s’en sortira le programme <img data-src=" />



<img data-src=" />








hadoken a écrit :



C’est faux, aucune ordinateur n’est capable d’analyser “tous les coups” pour aller à l’échec et mat… Le nombre de coups est exponentiel, totalement incalculable, […]&nbsp;





Farpaitement.

&nbsp;

&nbsp;Il existe une base de données (plusieurs dizaines de téras je crois) de tous les coups possibles pour les fins de partie de 6 pièces ou moins. En l’exploitant, un ordinateur a la garantie absolue de jouer le coup “parfait” dans ces conditions.



La base de données pour 7 pièces n’a pas encore été totalement calculée (et à la grosse louche &nbsp;il faut s’attendre à ce qu’elle soit de l’ordre de 100 fois plus grande encore…)



La base de données pour 8 pièces est actuellement totalement hors de portée, alors pour 32 c’est même pas la peine de rêver…









latlanh a écrit :



J’ai du mal à me dire que plusieurs joueurs pro d’echec (avec leur Ego) arrivent a se mètrent d’accord entre eux aussi vite qu’un joueur seul (qui plus est, le meilleur )…





Tu vas rire, je suis d’accord ! Avec moi-même bien sûr.

&nbsp;

Bah, si on les a déjà convaincus de garder le secret et d’attribuer la victoire à l’ordinateur seul, je crois que leur ego, ils se le sont déjà plié bien serré !&nbsp;



&nbsp;



Merki, c’est fort intéressant.








33A20158-2813-4F0D-9D4A-FD05E2C42E48 a écrit :



&nbsp;

&nbsp;Il existe une base de données (plusieurs dizaines de téras je crois) de tous les coups possibles pour les fins de partie de 6 pièces ou moins. En l’exploitant, un ordinateur a la garantie absolue de jouer le coup “parfait” dans ces conditions.



La base de données pour 7 pièces n’a pas encore été totalement calculée (et à la grosse louche &nbsp;il faut s’attendre à ce qu’elle soit de l’ordre de 100 fois plus grande encore…)





Pour 4 pièces, les tables font 30Mo

Pour 5 pièces, on passe à 7 Go

Et pour 6 pièces, on tape les 1.2 To !!



Les tables sont dispo ici:http://kirill-kryukov.com/chess/tablebases-online/

Mais le plus simple est de jouer avec les tables ici :http://k4it.de/?topic=egtb&lang=en

Tu rentres une position et quasiment immédiatement tu sais si ça gagne <img data-src=" />



&nbsp;

Pour en revenir à la news, je suis quand même super bluffé qu’un ordinateur ait réussi à battre le meilleur mondial, même sur une seule partie, c’est un exploit énorme <img data-src=" />



Pas mal le pseudo, pendant un moment j’ai cru à un troll qui me répondait.



Oui, j’ai pas explicité plus mes propos, mais tu as étendu ma pensée.

Effectivement, ça ne fait que calculer, mais qui ne calcul pas en fin de compte?

Dans la finalité, ces algo apprennent à répondre de mieux en mieux à leur environnement.



J’ai toujours détesté les réseaux de neurones, alors que je suis ébahi face à ce qu’ils peuvent faire.

En revanche, j’ai toujours adoré les algo génétiques. Plus simple à coder je trouve…


On trouve assez facilement des articles qui expliquent que AlphaGo tourne sur le cloud de Google, mais je n’ai trouvé aucune indication sur les ressources allouées.



Personne n’a remarqué de ralentissement chez Google entre 5h et 9h ce matin ? ;-)


Lee Sedol a abandonné, ce qui est classique au Go. Le commentateur en anglais indiquait que ça se jouait à quelques points, mais qu’il avait du mal à compter sur le tableau utilisé pour la présentation.



Mon opinion perso est que c’est dommage de ne pas aller au bout de la partie, surtout si elle est serrée. C’est considéré comme tout à fait normal au go d’arrêter quand l’issue est certaine. Mais il s’agit ici de parties qui sont regardées par beaucoup de gens qui ne connaissent pas le jeu, et le fait de ne pas aller au bout rends le truc encore plus cryptique.








Wawet76 a écrit :



Personne n’a remarqué de ralentissement chez Google entre 5h et 9h ce matin ? ;-)





Bah non puisque l’horaire est bien choisi ! <img data-src=" />









MoonRa a écrit :



“le nombre de combinaisons possibles est supérieur au nombre d’atomes dans l’Univers ” C’est pas un peu putassier ça? Je croyais que l’univers était infini ou tout du moins qu’on ne connaissait pas ces limites.



L’univers peut être infini mais ne comporter qu’une quantité finie de matière…enfin si on ne considère que la matière au sens “atomes”. Si on prend en compte la matière noire, c’est plus compliqué à conceptualiser



Surtout qu’en général on parle implicitement de l’univers visible, donc un truc parfaitement limité








Gundar a écrit :



Les dames aussi sont résolues.





Le Poker Holdem’ Heads Up est également résolu.









Gundar a écrit :



Les dames aussi sont résolues.





Alors que les femmes sont toujours imprévisibles.



Plus ou moins HS : C’est vraiment très intéressant (je ne connais pas trop ce domaine contrairement à beaucoup ici visiblement <img data-src=" />) mais tu as l’air de bien maîtriser le sujet, tu aurais des ressources (pour profane !) à conseiller ?


<img data-src=" />

<img data-src=" />


Lee Sedol a peut être juste évalué les coups de la machine pour voir sa façon de jouer, quitte à y laisser un match.Les 2 prochaines rencontres seront intéressantes je pense (et on sera fixé si la machine les gagne toutes).








Wawet76 a écrit :



On trouve assez facilement des articles qui expliquent que AlphaGo tourne sur le cloud de Google, mais je n’ai trouvé aucune indication sur les ressources allouées.&nbsp;





J’ai essayé de faire une recherche sur Google qui a donné la chose suivante: j’obtiens un lien vers un article de wired dans le résumé duquel, il est indiqué que c’est un cluster de 170GPUs et 1200CPUs. Par contre, plus de trace dans l’article et dans le cache.



L’hypothèse est que Google ne souhaite pas communiquer sur les ressources allouées. Si ce qui tend à être un extrait de l’article de wired original est exact, nous sommes loin de faire tourner cela sur un PC standard. Néanmoins, cela montre que l’addition réseau neuronal multicouche + base de données est une architecture efficace dans le sens où cela produit des résultats.



Pour moi, le but de l’AI n’est pas de trouver le meilleur résultat mais plutôt de trouver un résultat optimal dans un espace contraint par des variables aussi disparates que le temps, l’espace, les ressources mobilisables…



J’aimerais par exemple pouvoir avoir un logiciel prédictif pour ce qui est de mes déplacements professionels qui prendrait en compte plus seulement le lieu de départ et d’arrivée mais aussi la ponctualité des moyens de transports empruntés, le budget que je suis prêt à allouer, le temps de voyage que je suis prêt à supporter tout en s’assurant qu’aucun mouvement social ou prévision météorologique ne vont perturber ce voyage.



En gros si, l’univers est limité puisqu’il a un âge (13.5 GA) et que la vitesse de la lumière est elle-même limitée…

Donc en caricaturant à l’extrême on pourrait dire que l’univers est “contenu” dans une sphère de 13.5 millards d’années-lumière de rayon…




&nbsp; Lee Sedol, le champion coréen, est&nbsp;sorti des sentiers battus afin de tenter déstabiliser l’ordinateur





Tenter de prendre l’ascendant psychologique sur un ordinateur… mais bien sûr&nbsp; <img data-src=" />








coolraoul a écrit :



Pour moi y a aucune “intelligence” artificielle la dedans.



Juste un algo, pas fondamentalement compliqué, qui calcul des centaines de millions de combinaison et qui accumule de l’experience en priorisant les combinaisons qui l’ont mené a la victoire.





Parce que les joueurs n’utilisent pas d’algo ? N’apprenent pas à partir d’autres parties pour se faire une base de connaissances ?



Définit moi précisément le concept d’intelligence et là on pourra vraiment voir s’il y en a ou pas dans l’algo.



L’univers observable est une sphère de 82 milliards d’années-lumières de diamètres.








tazvld a écrit :



Le libre arbitre ? dans un cerveau qui n’est que réaction chimique et physique. Tout au plus, un touche d’aléatoire en plus dans un univers chaotique. Le libre arbitre existe-t-il vraiment ?

Considéré ne pas avoir de libre arbitre nous est très dérangeant à plusieurs niveaux, aussi bien pour l’égo, mais le libre arbitre nous est nécessaire pour pouvoir juger par exemple, sans libre arbitre, nous ne pouvons plus être coupable de nos actions.





Tu veux dire responsable je pense.



Sébastien Gavois: c’est possible d’ARRETER de lire la conneries des atomes à chaque intervention sur la question ? laisse les autres journalistes le faire.C’est comme dire qu’a starcraft il y a 100 milliards de coup possible par action car on peut cliquer a chaque endroit de la map.&nbsp;

oui je peux jouer A1 tout le temps&nbsp; mais 355 fois sur 361 ca sert a rien !








divide a écrit :



Ah, la douce illusion :)



En tout cas c'est mon opinion, personellement je crois fermement au déterminisme de l'univers, et que par conséquent nous n'avons que l'illusion du choix, si l'on considère que toutes nos pensées ne sont que le résultat de flux electriques sautant de neurones en neurones dans notre cerveau...    





Comme AlphaGo s’appuie massivement sur un réseau de neurones, il répond pour moi à une plasticité similaire au cerveau humain (capacité d’apprentissage et de prédiction suite à la répétition d’expériences), et se qualifie donc tout à fait en tant qu’IA.





L’univers n’est pas déterministe, à échelle quantique. Mais ça ne prouve pas qu’il existe un libre arbitre, ni de l’aléatoire dans nos possibles choix. Nos connaissances sur le cerveau ne permettent pas non plus de statuer la non-existence du libre-arbitre. Les parallèles entre informatique et cerveau sont très discutables, déjà rien que sur le stockage des “données”, faut pas trop prendre au sérieux l’utilisation de termes biologiques pour des algos (et encore moins les nostradamus du transhumanisme).



On peut trucher la question en considérant que vue la complexité des processus de décision et notre incapacité à en remonter véritablement le fil, déterminisme ou non, il s’agit d’une forme de libre-arbitre. Mais c’est botter en touche, et nier l’influence majeur du vécu, de l’environnement, des structures, ce serait incongru.









hollaamic a écrit :



Plus ou moins HS : C’est vraiment très intéressant (je ne connais pas trop ce domaine contrairement à beaucoup ici visiblement <img data-src=" />) mais tu as l’air de bien maîtriser le sujet, tu aurais des ressources (pour profane !) à conseiller ?





Pfoooooooyayayaillle…&nbsp;Malheureusement je n’ai d’expert en la matière que l’apparence…&nbsp;On va dire qu’il nage à la surface de l’insondable puits d’ignorance que je suis quelques&nbsp;fragiles bulles de savoir (là je me rappelle la référence, c’est Achille Talon et le grain de la folie).



Je m’étais intéressé à la chose il y a fort longtemps, dans des vrais livres en vrai papier, qui ont disparu de ma bibliothèque depuis longtemps. J’ai trouvé ceci :



https://fr.wikiversity.org/wiki/R%C3%A9seaux_de_neurones

&nbsp;

Il y a auss les vidéos de Hugo Larochelle sur Youtube, super, mais c’est quand-même assez raide (niveau universitaire)&nbsp;



https://www.youtube.com/watch?v=L7WNYvbvGBc

&nbsp;

&nbsp;(et le truc le plus intéressant est en anglais - mais l’accent canadjin est toujours là…)

&nbsp;

https://www.youtube.com/watch?v=SGZ6BttHMPw&index=1&list=PL6Xpj9…

&nbsp;









Lauster a écrit :



Lee Sedol a peut être juste évalué les coups de la machine pour voir sa façon de jouer, quitte à y laisser un match.Les 2 prochaines rencontres seront intéressantes je pense (et on sera fixé si la machine les gagne toutes).





C’est surtout le prochain match qui est décisif pour Lee Sedol, s’il le perd, il a perdu la rencontre.



Très honnêtement, le coup du “je perd pour voir comment tu joues” c’est de la stratégie pour le jeu casu non-compétitif entre potes autour d’une pizza. Quand t’as 1 million de dollar à la clé, tu donnes tout ce que tu as, dès le début pour écraser ton adversaire.&nbsp;









loser a écrit :



ascendant psychologique



tu es le seul à vouloir utiliser ce terme. loser.



edit: foirage


Le problème c’est quand tu joue contre un adversaire que tu n’as jamais vu jouer et qui connait toutes tes parties par coeur. Il faut bien tester un peu la réaction de l’adversaire.








gragra a écrit :



C’est énervant, ces histoires de “machines”, “ordinateurs” plus fort que…

En l’occurrence c’est bien le programme informatique développé par des chercheurs humains qui va se mesurer à un cerveau humain sugar powered.



D’après wikipedia deepblue son pendant pour les échecs&nbsp; “occupait la 259e place au TOP500 des supercalculateurs avec une puissance de calcul de 11,38&nbsp;GFLOPS”.



Donc ok pour l’avancée programmatique qui me passe largement au-dessus, mais quid de la puissance du moteur ?





Aucune importance pour le GO. &nbsp;C’est bien l’algo qu’il faut regarder, comment réussir à faire comprendre à une machine des concepts positionnels. L’homme utilise sa mémoire et est capable de “théoriser”, il a une intelligence abstraite. Là cela parait compliqué à expliquer. Aux echecs, les ordinateurs trichent, ils utilisent une bibliothèque d’ouverture fabriquée par l’homme et épurée par des grands maîtres des variantes douteuses et ont une puissance de calcul pour punir les erreurs tactiques.



Là comment ils font…. C’est en tout cas, une belle performance humaine que d’avoir programmé cela ;)



(petite précision, je pense que c’est une erreur de vouloir qu’une machine soit douée d’une intelligence émotionnelle, l’émotion étant liée aux processus chimique du corps humain, cela ne ne me semble pas pertinent, donc intellectuellement une machine pourrait dépasser l’homme dans sa capacité de raisonnement tout en ayant autant d’émotion qu’un psychopathe)

&nbsp;









Pochi a écrit :



C’est surtout le prochain match qui est décisif pour Lee Sedol, s’il le perd, il a perdu la rencontre.



Très honnêtement, le coup du “je perd pour voir comment tu joues” c’est de la stratégie pour le jeu casu non-compétitif entre potes autour d’une pizza. Quand t’as 1 million de dollar à la clé, tu donnes tout ce que tu as, dès le début pour écraser ton adversaire.&nbsp;





Il n’y a pas besoin de perdre pour tester les réactions de l’adversaire, juste de réduire un peu les chances de gagner. Un peu comme tester quelques excentricités sur un fps pour voir la réaction des bots (qui techniquement peuvent êtres imbattables en face à face, niveau réflexe et précision). Mais il s’agit d’un tout autre niveau de bot, et ce n’est pas forcément applicable au Go, jeu que je connais mal.



Pourquoi est-ce que le prochain match est décisif ?



Le champion est inquiet :&nbsp;

“Aujourd’hui, je sais comment son algorithme a réussi à réduire le nombre de choix possibles. J’ai le sentiment qu’AlphaGo peut dans une certaine mesure imiter l’intuition humaine”“A présent, je crois que je ne pourrais peut-être pas vaincre AlphaGo avec une marge aussi importante que 5-0. Je dois être un peu plus stressé”.“Je pense que l’IA va à terme battre les humains au Go et qu’il s’agit de la conséquence inévitable du changement”, a ajouté le champion sud-coréen. “Mais les robots ne comprendront jamais la beauté du jeu comme nous, les humains, la comprenons”.


C’est curieux que personne ici ne parle du cours de Yann LeCun au Collège de France, qui a pourtant été largement médiatisé lors de la conférence d’ouverture il y a quelques semaines, et qui est le père de l’apprentissage profond par convolution.



AlphaGo n’utilise pas exclusivement cette technique, mais le cour est intéressant car il est donné par une pointure mondiale sur le sujet, et parce que ça permet de bien situer ce qu’il est aujourd’hui capable d’attendre de la part de ces techniques. La labellisation automatique à la fin de la conférence d’ouverture est assez bluffante par sa précision (le tout en temps réel s’il vous plaît).





C’est dispo ici :http://www.college-de-france.fr/site/yann-lecun/course-2015-2016.htm




AlphaGo n’utilise pas exclusivement cette technique, mais le cour est intéressant car il est donné par une pointure mondiale sur le sujet, et parce que ça permet de bien situer ce qu’il est aujourd’hui capable d’attendre de la part de ces techniques.&nbsp;&nbsp;



En shorter on peut imaginer quoi ? Les 50 prochaines années ?&nbsp;








Infolibre a écrit :



Pourquoi est-ce que le prochain match est décisif ?





Après réflexion, je pense que j’ai mal compris un commentaire qui parlais de W+res, je pensais qu’il y avait déjà eu 2 matchs de joués et non pas qu’un.









Pochi a écrit :



Après réflexion, je pense que j’ai mal compris un commentaire qui parlais de W+res, je pensais qu’il y avait déjà eu 2 matchs de joués et non pas qu’un.





Ca semble plus logique ^^



L’exploit serait de battre rien qu’une fois AlphaGo. Ca laisserait entrevoir la possibilité de le battre 5-0 lors d’une autre rencontre. La stratégie n’est que du calcul, et l’algo d’alphago a déjà montré ses capacités exemplaires (et potentiellement supérieures). La part moins chiffrable qu’est la psychologie ne s’applique pas à l’IA. Il faudrait déceler une faille issue de la conception, qui si elle existe permettrait de reprendre l’avantage coté humain, mais “le meilleur joueur de” n’est pas forcément le plus qualifié pour. Ou ddos les serveurs google <img data-src=" />









Infolibre a écrit :



Ca semble plus logique ^^



L’exploit serait de battre rien qu’une fois AlphaGo. Ca laisserait entrevoir la possibilité de le battre 5-0 lors d’une autre rencontre. La stratégie n’est que du calcul, et l’algo d’alphago a déjà montré ses capacités exemplaires (et potentiellement supérieures). La part moins chiffrable qu’est la psychologie ne s’applique pas à l’IA. Il faudrait déceler une faille issue de la conception, qui si elle existe permettrait de reprendre l’avantage coté humain, mais “le meilleur joueur de” n’est pas forcément le plus qualifié pour. Ou ddos les serveurs google <img data-src=" />







Pas de faille de conception. C’est plutôt la question liée à l’apprentissage. Si il a réellement ingurgité la totalité des problématiques positionnelles, alors il est pratiquement imbattable… &nbsp;Apparemment, il l’aurait sorti des sentiers battus pour le mettre en situation inconnue…. Et malgré cela il a perdu… Donc c’est inquiétant.









clemsfr a écrit :



Pas de faille de conception. C’est plutôt la question liée à l’apprentissage. Si il a réellement ingurgité la totalité des problématiques positionnelles, alors il est pratiquement imbattable… &nbsp;Apparemment, il l’aurait sorti des sentiers battus pour le mettre en situation inconnue…. Et malgré cela il a perdu… Donc c’est inquiétant.





Possible, je ne connais pas assez ce type d’algo ni le jeu de Go.

/join #op_alphagoat









Pochi a écrit :



C’est surtout le prochain match qui est décisif pour Lee Sedol, s’il le perd, il a perdu la rencontre.



Très honnêtement, le coup du “je perd pour voir comment tu joues” c’est de la stratégie pour le jeu casu non-compétitif entre potes autour d’une pizza. Quand t’as 1 million de dollar à la clé, tu donnes tout ce que tu as, dès le début pour écraser ton adversaire.





Eu… c’est pourtant ce que font 90% des coréen sur Sc2 quand ils connaissent pas l’adversaire…

Donc casu non.









Pochi a écrit :



C’est surtout le prochain match qui est décisif pour Lee Sedol, s’il le perd, il a perdu la rencontre.



Très honnêtement, le coup du “je perd pour voir comment tu joues” c’est de la stratégie pour le jeu casu non-compétitif entre potes autour d’une pizza. Quand t’as 1 million de dollar à la clé, tu donnes tout ce que tu as, dès le début pour écraser ton adversaire.





Il n’a pas déclarer avant la rencontre que si il gagne pas les 5 match, ça n’a aucun intérêt?



J’ai regadé le match cette nuit jusqu’à 8h30, le jeu était vraiment serré et d’après les commentateurs alphaGo était très agressif comparé aux dernières fois.



Je serai présent aux prochains matchs, c’est vraiment intéressant de voir un algo bien jouer <img data-src=" />


En fait c’est beaucoup plus compliqué que ça.

L’algorithme possède deux réseaux neuronaux entrainnés (deep learning) avec un très grand nombre de partie déjà joué ce qui lui permet d’estimer la valeur d’un coup et le second lui permet de choisir la pertinence du coup.



Mais l’originalité car comme tu le dis , il ne peut pas estimer tous les coups possible.&nbsp;Il va donc les choisir au hasard.&nbsp;&nbsp;l’entrainement et le modèle d’apprentissage prend ensuite le relais en choisissant le bon coup à jouer.

Il faut une très grande puissance de calcul pour faire ça.

La grande différence est que la machine va jouer des millions de partie différente et trouver la bonne, l’humain non.

&nbsp;








Qruby a écrit :



Le Poker Holdem’ Heads Up est également résolu.





Heads up et limits. C’est aussi une grosse restriction, limits. (contrairement au “no limit”, où on peut miser/relancer n’importe quel montant entre la blinde/mise précédente et tout son tapis, au limit, on peut juste check/fold/call ou relancer d’une mise fixée. Ça fait seulement 4 possibilité à chaque décision (au plus. En vrai trois. Parce que folder si il n’y a pas eu de bet, c’est l’inverse d’optimal), contre beaucoup plus dans le no limit.(par exemple si les blindes sont 1020 et que tu as 2000 de tapis, tu peux ouvrir pour n’importe quel montant entre 40 et 2000. Bon après 1999 est surement éliminable, par exemple)



Concernant le Morpion, l’humain résiste : n’importe quel môme de 7 ans arrache le match nul à la machine.


ah oui c’est juste je n’avais pas pris en compte l’expansion. Bref, c’est très grand, mais pas infini.








le podoclaste a écrit :



Concernant le Morpion, l’humain résiste : n’importe quel môme de 7 ans arrache le match nul à la machine.





C’est surtout ce jeu qui est mal foutu, et qui conduit à 100% de match nul quand c’est une partie avec 2 humains un minimum entrainés (cad qui connaissent les&nbsp;grosses erreurs (y’a pas 50 cas non plus, pour le premier par exemple, seulement 3 possibilités, un coin, un bord ou le centre))&nbsp;<img data-src=" />









yoda222 a écrit :



Heads up et limits. C’est aussi une grosse restriction, limits. (contrairement au “no limit”, où on peut miser/relancer n’importe quel montant entre la blinde/mise précédente et tout son tapis, au limit, on peut juste check/fold/call ou relancer d’une mise fixée. Ça fait seulement 4 possibilité à chaque décision (au plus. En vrai trois. Parce que folder si il n’y a pas eu de bet, c’est l’inverse d’optimal), contre beaucoup plus dans le no limit.(par exemple si les blindes sont 1020 et que tu as 2000 de tapis, tu peux ouvrir pour n’importe quel montant entre 40 et 2000. Bon après 1999 est surement éliminable, par exemple)





C’est vrai j’oubliais ce détail d’importance. Cela dit, c’est une belle prouesse, et l’algo semble performant même pour du no limit, avec notamment des stratégies d’ouvertures qui ressemblent fortement à celles des bons joueurs.



C’est vrai qu’on ne trouve pas grand chose.

Perso j’ai fini par trouver ici :



AlphaGo Distributed, in its largest variant, used 280 GPUs and 1920 CPUs.





Evidemment, j’ai rien trouvé comme autre source, ni même concernant le match AlphaGo versus Fan Hui par exemple…



EDIT/ Contre Fan Hui, il y aurait eu 1 202 CPU et 176 GPU








Kikilancelot a écrit :



L’univers observable est une sphère de 82 milliards d’années-lumières de diamètres.



A nuancer, les objets que nous voyons aujourd’hui se trouvent probablement aujourd’hui à 82 Md AL mais à l’époque où ils ont émis la lumière qu’on voit aujourd’hui ils étaient à 13.515 Md AL.



Tout objet situé + loin que ça s’éloigne trop vite de nous pour que sa lumière nous atteigne un jour. Ce qu’on observe avec les télescopes modernes c’est l’univers tel qu’il était dans sa jeunesse



Edit : quote pour que Loser ai l’info





loser a écrit :



ah oui c’est juste je n’avais pas pris en compte l’expansion. Bref, c’est très grand, mais pas infini.




Merci pour le lien : chinois: Ça me rappelle mes vieux cours de traitement du signal.


Merci je recherchais justement quels livres pouvaient faire figure de référence de départ, et surtout en effet des videos de type université en ligne, je vais me pencher dessus <img data-src=" />


2ème victoire à l’instant d’AlphaGo sur l’humain.


pourquoi factorielle ?

Perso je calcule le nombre de combinaisons comme suit :

il y a 19 x 19 emplacements (soit 361), et 3 possibilités pour un emplacement : pierre blanche, pierre noire, pas de pierre.

Le nombre d’arrangement est donc : 3 puissance 361, soit 1,7 x 10 puissance 172


Celle ci a été plus serrée (et plus longue à obtenir) mais oui : 2-0 pour alphago








Koxinga22 a écrit :



pourquoi factorielle ?

Perso je calcule le nombre de combinaisons comme suit :

il y a 19 x 19 emplacements (soit 361), et 3 possibilités pour un emplacement : pierre blanche, pierre noire, pas de pierre.

Le nombre d’arrangement est donc : 3 puissance 361, soit 1,7 x 10 puissance 172





Ton calcul donne le nombre de positions possibles, pas le nombre de moyens d’arriver a ces positions.









Koxinga22 a écrit :



pourquoi factorielle ?

Perso je calcule le nombre de combinaisons comme suit :

il y a 19 x 19 emplacements (soit 361), et 3 possibilités pour un emplacement : pierre blanche, pierre noire, pas de pierre.

Le nombre d’arrangement est donc : 3 puissance 361, soit 1,7 x 10 puissance 172





Je parlais du nombre de parties possibles, pas le nombre de grille finale. 1,7×10¹⁷² c’est beaucoup, mais il y a encore plus de façon d’y arriver.



Tu calcules le nombre d’arrangement (état du Goban à un instant), mais pas le nombre de parties différentes possibles. J’ai trouvé&nbsp;ce papier&nbsp;qui fait un peu la différence entre les deux&nbsp;<img data-src=" />



Edit : Double grilled








ldesnogu a écrit :



Ton calcul donne le nombre de positions possibles, pas le nombre de moyens d’arriver a ces positions.









zefling a écrit :



Je parlais du nombre de parties possibles, pas le nombre de grille finale. 1,7×10¹⁷² c’est beaucoup, mais il y a encore plus de façon d’y arriver.









zefling a écrit :



Je parlais du nombre de parties possibles, pas le nombre de grille finale. 1,7×10¹⁷² c’est beaucoup, mais il y a encore plus de façon d’y arriver.





<img data-src=" />

Je vais lire ce papier pour faire la distinction.

Pour l’instant (avant lecture) je ne saisis pas trop l’intérêt du chiffre : quel que soit le moyen(chemin) pour arriver à une position, il passe par les autres positions incluses dans la collection de 10 puissance 172.

Cette estimation n’ayant utilité (pour moi) que de démontrer que l’approche brute force est irrationnelle.



Oui la brute force est même stupide, on arrive à de valeur totalement inatteignable, même pour les échecs, alors encore moins pour le go.


J’aime noter la différence d’ordre de grandeur entre go et échecs. Aux échecs, tu peux construire un arbre des N prochains coups, c’est faisable (et fait) et dans cette optique, l’ordi a bruteforcé le jeu pour gagner à tous les coups contre l’humain.



Au go, c’est impossible, même pour les 3 prochains coups la combinatoire dépasse nos meilleurs calculateurs. Il faut obligatoirement trouver une nouvelle façon de faire que “juste” calculer (construire un arbre et le parcourir).



De toutes façon -l’équipe DeepMind le rappelle à chaque interview- quand on demande à un maitre de Go pourquoi il a joué tel coup, il n’y a pas de réponse rationnelle mais plutôt des truc du genre “j’ai senti qu’il fallait jouer là”.

Il n’y a pas d’algorithme (de méthode) pour bien jouer au Go, il faut avant tout s’imprégner des bons patterns, qui peuvent prendre des milliers de formes distinctes ayant chacune de nombreuses variations. Il me semble que l’humain accomplit ce travail avec une logique “irrationnelle” (je ne trouve pas de terme adéquat mais disons “non basée sur le calcul et la certitude”), on définit des concepts abstraits comme “zone d’influence”, “potentiel”, “initiative”, etc puis on fait une sorte de moyenne de tous ces indicateurs pour “sentir” le bon coup.



L’approche Deepmind a été exemplaire en la matière : c’est exactement ce qu’ils ont fait (et réussi : 2 victoires contre un 9 dan, moi je dis chapeau). Pour préciser ce qui a déjà été dit : il s’agit de 2 réseaux neuronaux en série. Le premier fait une “estimation de valeur” réduisant les coups possibles à un nombre raisonnable et le résultat passe dans le deuxième réseau qui fait une “estimation éthique” pour réduire encore ce nombre de coups.

Le travail de calibrage a donc consisté à lui faire ingurgiter des millions de parties pour déterminer le coup gagnant d’après telle configuration du goban.



Ca a l’air con maintenant que c’est fait mais rappelons-nous que c’était de la science fiction il y a tout juste quelques mois (voire semaines). Je m’enflamme mais on est à un moment charnière de l’IA, le Go devait être le dernier jeu de stratégie réfractaire à l’IA. Il nous a poussé à développer une techno très pointue, j’attends de voir ses futures applications, ça peut faire des merveilles.


Si cela continue comme cela, il va falloir faire une nouvelle partie avec 9 points de handicap pour AlphaGo pour voir jusqu’où va la déculotée <img data-src=" />








Z-os a écrit :



Si cela continue comme cela, il va falloir faire une nouvelle partie avec 9 points de handicap pour AlphaGo pour voir jusqu’où va la déculotée <img data-src=" />





Ça serait drôle, le 9e dan avec 9 pierres de handicap. <img data-src=" /> (Bon, j’abuse un peu <img data-src=" />)







Koxinga22 a écrit :



Il me semble que l’humain accomplit ce travail avec une logique “irrationnelle” (je ne trouve pas de terme adéquat mais disons “non basée sur le calcul et la certitude”), on définit des concepts abstraits comme “zone d’influence”, “potentiel”, “initiative”, etc puis on fait une sorte de moyenne de tous ces indicateurs pour “sentir” le bon coup.







L’influence, on m’en a beaucoup parlé quand j’ai commençais à jouer (bon, j’ai vite arrêté parce que je sentais bien que ce n’était pas un jeu pour moi).



Ca n’a rien d’étonnant , ils jouent des millions de partie de manière aléatoire puis les examine et trouve le meilleur choix avec son réseau de neurones entrainnés sur les parties types.

Il faut une sacrée puissance de calcul, c’est presque déséquilibré comme match en fait. Les champions humains faisant très peu d’erreur ont leur chance.&nbsp;Par contre un joueur lambda se fera pulvériser.

&nbsp;


La suite samedi matin à 4h30 pour ceux qui vont se poser la question demain matin. ;-)








Z-os a écrit :



La suite samedi matin à 4h30 pour ceux qui vont se poser la question demain matin. ;-)





Merci, je venais justement aux nouvelles pour connaitre le résultat du 3ème match. ^^









Koxinga22 a écrit :



Il me semble que l’humain accomplit ce travail avec une logique “irrationnelle” (je ne trouve pas de terme adéquat mais disons “non basée sur le calcul et la certitude”), on définit des concepts abstraits comme “zone d’influence”, “potentiel”, “initiative”, etc puis on fait une sorte de moyenne de tous ces indicateurs pour “sentir” le bon coup.







Plus qu’irrationnelle je pense que l’on peut parler de probabilité.



Avec le nombre de parties et le développement de la connaissance du fonctionnement du jeu (via l’expérience et la théorie) le cerveau humain arrive à déterminer avec une certaine marge d’erreur la probabilité du meilleur coup suivant.



Ce qui donne l’impression d’irrationnel est que ce calcul ne se fait pas sur le premier plan de la pensée, mais se fait en arrière plan, et commence probablement dès les premiers coups joués, ajoutant au fur et à mesure des nouveaux paramètres aux calculs, les ajustant en permanence.



Les concepts abstraits étant quand à eux un ensemble de paramètres que le cerveau organise et utilise comme variables d’ajustements.



AlphaGo faisant au final la même chose, mais de manière plus transparente pour nous.



A noter qu’au départ il n’y avait pas de limites de temps, et que les parties pouvaient durer plusieurs jours. Je laisse imaginer l’état de chauffe du cerveau au bout de 2-3 jours sur une seule partie, avec les calculs à la fois conscients et inconscients qui se faisaient.









Z-os a écrit :



La suite samedi matin à 4h30 pour ceux qui vont se poser la question demain matin. ;-)





Merci pour l’info :)







Icon a écrit :



A noter qu’au départ il n’y avait pas de limites de temps, et que les parties pouvaient durer plusieurs jours. Je laisse imaginer l’état de chauffe du cerveau au bout de 2-3 jours sur une seule partie, avec les calculs à la fois conscients et inconscients qui se faisaient.





C’est toujours le cas pour les rencontres de très haut niveau. Pour le titre de Meijin ou Kisei (au japon) chaque joueur à un temps de réflexion de 8h, les parties durent donc 2 jours.



Plus longue, oui, parce que Lee Sedol avait du mal a voir où AlphaGo l’emmenait, plus serrée, bof, vue le différentiel final d’environs 30 points, c’est l’équivalent d’un 6p face a un 9p, soit un gouffre.


Bon bah, il semblerait qu’AlphaGo soit encore en train de démonter de l’humain pour la 3ème fois…


Démontage terminé. 3-0 avec un score aux environs des 70-45 hors captures (le coin bas gauche semblait assez épique, mais finalement AlphaGo qu’on pensait avoir peur des échanges … A juste fait un truc du genre “fuck it, j’ai plus de coups d’avance que toi et une lecture propre du goban”.



Edit : j’attend la conférence de presse qui risque d’être “j’ai essayé mais il est vraiment trop fort”.


Prochaine victime<img data-src=" /> <img data-src=" /> Ah les égos des joueurs. <img data-src=" />


A voir comment vont se dérouler les 2 dernières manches. Si y’a 5-0 avec des scores aussi fleuves que les matches 2 et 3 pour 4 et 5, soit Lee Sedol a un jeu qui n’est plus adapté aux ouvertures et lectures de ses concurrents (peu probable), soit va falloir penser a ouvrir des nouveaux niveaux (mais y’a quoi au dessus de 9p ?)








Z-os a écrit :



Prochaine victime<img data-src=" /> <img data-src=" /> Ah les égos des joueurs. <img data-src=" />



Il fait le KeKe. Il vaut mieux qu’il n’attende pas trop sinon il pourrait bien jouer contre “BetaGo”…



Là où l’ordinateur a été incontestablement supérieur à Lee Sedol, c’est l’humilité ! Ce qui est marrant c’est qu’au départ, il était présenté comme le meilleur joueur du monde (je crois d’ailleurs qu’il est le premier à se considérer comme tel) puis après une défaite, c’était “un des meilleurs joueurs du monde” sur lemonde.fr, bientôt, ça sera “l’ordinateur a battu un coréen” :).



J’ai hate de voir un match du style au shogi &nbsp;la machine contre&nbsphttps://fr.wikipedia.org/wiki/Yoshiharu_Habu&nbsp;



&nbsp;


3-1 pour la machine, l’honneur est sauf.








Z-os a écrit :



3-1 pour la machine, l’honneur est sauf.





L’intelligence est-elle supérieure à l’arrogance chez les ingés Google qui ont baissé d’un cran le level de leur IA ?

Mais je suis mauvaise langue, Lee Sedol a manifestement trouvé un joseki extrêmement rare qui lui a donné la victoire. Le coté négatif, c’est qu’AlphaGo apprend en jouant des parties, il connait donc désormais ce joseki.

En fait, Google paye 1 M$ pour que les meilleurs joueurs du monde viennent blinder leur soft. Malin.



Ils ne payent pas, puisqu’il fallait gagner 3 parties pour gagner 1M$ : Les pros bossent gratos ! :)








Velu a écrit :



Ils ne payent pas, puisqu’il fallait gagner 3 parties pour gagner 1M\( : Les pros bossent gratos ! :)





C'est vrai ... disons qu'ils risquent 1 Million :)



Edit : en fait si, parce que même en cas de victoire ils ont annoncé faire don de la somme à une assoc donc pour eux c'est de l'argent qu'ils s'attendent à donner quoi qu'il arrive ;)



Re-edit : pour plus de précision :



The prize for winning was \)
1 million. As AlphaGo was the winner, the prize will be donated to charities, including UNICEF. Lee Sedol will receive \(170,000 (\)150,000 for participating in all the five games, and an additional $20,000 for each win).