Google : d’une recherche aux résultats, en passant par un index de 100 000 To

30 000 milliards de pages et moi, et moi et moi...

Google vient de mettre en ligne une infographie interactive afin de détailler un peu le principe de fonctionnement de son moteur de recherche. Le géant du web en profite pour dévoiler au passage quelques chiffres qui donnent le vertige : 30 000 milliards de pages web sont référencées via un index qui occupe 100 000 To.

Google a décidé de donner quelques informations sur son moteur de recherche et, pour cela, le géant du web a mis en place une infographie interactive baptisée : « How Search Works. From algorithms to answers » (Comment fonctionne la recherche. Des algorithmes aux réponses).

Bien évidemment, cela commence par naviguer sur le net afin de récupérer un maximum de données. Google indique référencer ainsi 30 000 milliards de pages web (soit plus de 4 000 par être humain) au sein d'un index qui occupe 100 000 To d'espace de stockage, excusez du peu.

Lorsque vous saisissez une requête, Google va d'abord se servir d'algorithmes maison afin de mieux comprendre votre demande (autocomplétion, correction orthographique, étude des synonymes, etc.). Les pages intéressantes sont ensuite récupérées via l'index dont nous vous parlions, avant d'être triées en fonction de divers critères : « qualité » du site et de la page, ancienneté sur le web, géolocalisation, etc.

Au final, Google annonce qu'entre le moment où vous validez votre recherche et celui où il vous retourne les résultats correspondants, il ne se passe que 0,125 seconde.

Une troisième partie s'intéresse enfin à la gestion du spam et aux différentes actions mises en place pour en supprimer un maximum, et ce, de manière automatique.

Bien évidemment, l'ensemble est schématisé et largement simplifié, mais les chiffres annoncés n'en restent pas moins intéressants. N'hésitez pas à cliquer sur les éléments qui composent cette infographie afin d'obtenir des détails sur certains points.

Accéder à l'infographie interactive. (en anglais).

Google rassemble ses équipes Android et Appareils

07:34 4

« Projet Nimbus » : Google licencie 28 salariés qui ont manifesté contre un contrat cloud avec Israël

07:32 8

JOP : la préfecture de Paris autorise deux nouvelles expérimentations de vidéosurveillance algorithmique (VSA)

07:31 4

La DGSE lance la 3e édition de 404CTF, « la plus grande compétition de cybersécurité de France »

07:24 0

Sous Windows 10 et 11, le Store reçoit d’importantes améliorations

07:21 20

Changer de Cap demande aux administrations de garantir la sécurité des données des Français

07:19 8

Commentaires (52)

Jarodd Abonné

Le 04/03/2013 à 08h 36

Google indique référencer ainsi 30 000 milliards de pages web

[…]

Au final, Google annonce qu’entre le moment où vous validez votre recherche et celui où il vous retourne les résultats correspondants, il ne se passe que 0,125 seconde.

" />" />" />

Edit : j’adore le “Cats” qui remonte sur une recherche “string theory” " />

Spezetois Abonné

Le 04/03/2013 à 08h 38

Les chiffres, ça impressionne toujours " />

kiliking

Le 04/03/2013 à 08h 42

sans parler du nombre de serveurs de recherche ainsi que ceux de secours et tout ce qui va avec….Je me demande combien ils ont dépensé rien qu’en PCs…" />

RinSa

Spezetois a écrit :

Les chiffres, ça impressionne toujours " />

Ce qui m’impressionne c’est comment la page est foutu " />

Des oufs chez google

carbier Abonné

Le 04/03/2013 à 08h 51

RinSa a écrit :

Ce qui m’impressionne c’est comment la page est foutu " />

Des oufs chez google

" /> Cela ne marche pas (ou mal) sur Opera.

Bill2

Jarodd a écrit :

" />" />" />

Edit : j’adore le “Cats” qui remonte sur une recherche “string theory” " />

C’est marrant, en utilisant FF, les “cats” ne sont pas apparu sur l’infographie.

Et sur IE10, y’a rien qui s’affiche quand je clique dessus, donc pas moyen de savoir pour “cats” ressort sur cette requete " />

bzc Abonné

Bien évidemment, l’ensemble est schématisé et largement simplifié

En effet et c’est dommage, j’aurais préféré qu’ils nous parlent de MapReduce, BigTable, GoogleFS …

Le 04/03/2013 à 08h 53

Sinon j’adore à la fin la partie sur le combat du SPAM.

Dans ce cas la pourquoi ne pas inclure dans leur infographie leur méthode de collecte des données personnelles et de gestion des cookies lors de nos recherches ?

En gros une bien belle pub’ qui reste ce qu’elle est: une pub…

knos

Le 04/03/2013 à 08h 55

4.000 pages par être humain. Comme quoi il y a du doublon et des pages inutiles.

NiCr Abonné

Le 04/03/2013 à 08h 59

#10

knos a écrit :

4.000 pages par être humain. Comme quoi il y a du doublon et des pages inutiles.

Cf la partie sur le SPAM " />

HarmattanBlow

#11

bzc a écrit :

En effet et c’est dommage, j’aurais préféré qu’ils nous parlent de MapReduce, BigTable, GoogleFS …

C’est ce que j’espérais également au vu de l’illustration de l’article. Malheureusement leur animation est dépourvue d’intérêt à mes yeux.

RaYz

#12

bzc a écrit :

En effet et c’est dommage, j’aurais préféré qu’ils nous parlent de MapReduce, BigTable, GoogleFS …

C’est une présentation de com grand public.

Mais bon je pense qu’on donnerait tous beaucoup ici pour voir comment ça marche de l’intérieur.

Le 04/03/2013 à 09h 06

#13

Bill2 a écrit :

C’est marrant, en utilisant FF, les “cats” ne sont pas apparu sur l’infographie.

J’ai le Cats sur Firefox 19.0.

phi1981

#14

30 Trillions de pages webs pour un index de 100 000 To.

…. ça fait beaucoup de données par page web.

L3 G33K

Le 04/03/2013 à 09h 10

#15

Le chat dans la théorie des cordes" />

#16

Jarodd a écrit :

J’ai le Cats sur Firefox 19.0.

Je viens de retenter sur FF19.0 et toujours pas …

Et je viens de relancer sur IE10, et je ne l’ai plus " />

Toea

Le 04/03/2013 à 09h 12

#17

“By the way, in the 452 seconds you’ve been on this page, approximately

17,438,160 searches were performed.”

Ah ouais, quand même…

mononokehime

Le 04/03/2013 à 09h 18

#18

Quand on y pense c’est quand meme la folie, Google télécharge littéralement internet pour faire son indexation, pas juste une ou deux pages par ci par la, Internet dans sa globalité, et les 100 000to c’est juste pour l’indexation, brrrrrrr

tazvld Abonné

Le 04/03/2013 à 09h 19

#19

bzc a écrit :

En effet et c’est dommage, j’aurais préféré qu’ils nous parlent de MapReduce, BigTable, GoogleFS …

De même, je me demande bien comment en moins de 0.5sec, ils arrivent à interroger stratégiquement leur base de donnée. Mon ordi pédale pour faire moins bien et portant les dossiers sont indexés

bombo

Le 04/03/2013 à 09h 25

#20

Je trouve ces chiffres un peu décourageant pour toute les sociétés qui souhaiteraient créer un nouveau moteur de recherche :-(

Le 04/03/2013 à 09h 28

#21

mononokehime a écrit :

Quand on y pense c’est quand meme la folie, Google télécharge littéralement internet pour faire son indexation, pas juste une ou deux pages par ci par la, Internet le Web public dans sa globalité, et les 100 000to c’est juste pour l’indexation, brrrrrrr

" />

anonyme_b93219f691a6afd6966660cd49d7951e

Le 04/03/2013 à 09h 33

#22

bombo a écrit :

Je trouve ces chiffres un peu décourageant pour toute les sociétés qui souhaiteraient créer un nouveau moteur de recherche :-(

Surtout quand tu vois la gueule du dernier née français Qwant

Zod

Le 04/03/2013 à 09h 43

#23

C’est quoi comme techno leur système de BDD d’ailleurs ?

C’est du maison ou ils utilisent quelque chose qui existe ?

Le 04/03/2013 à 09h 58

#24

Zod a écrit :

C’est quoi comme techno leur système de BDD d’ailleurs ?

C’est du maison ou ils utilisent quelque chose qui existe ?

Même si c’est du maison, ça “existe”. " />

Lister2k5

Le 04/03/2013 à 10h 01

#25

Bill2 a écrit :

C’est marrant, en utilisant FF, les “cats” ne sont pas apparu sur l’infographie.

Et sur IE10, y’a rien qui s’affiche quand je clique dessus, donc pas moyen de savoir pour “cats” ressort sur cette requete " />

Il y a plusieurs schéma.

Le 04/03/2013 à 10h 12

#26

Zod a écrit :

C’est quoi comme techno leur système de BDD d’ailleurs ?

C’est du maison ou ils utilisent quelque chose qui existe ?

C’est du maison.

Ils ne communiquent pas énormément sur les détails mais si tu veux faire quelques recherches ils utilisent un DBMS maison nommé BigData sur un FileSystem maison GFS, et ils utilisent un algo maison MapReduce pour l’indexation.

Tout ça n’étant évidemment pas sous GPL … et on dit que Google promeut le l’OpenSource … (Comment ça c’est pas vendredi ?)

Le 04/03/2013 à 10h 50

#27

Zod a écrit :

C’est quoi comme techno leur système de BDD d’ailleurs ?

C’est du maison ou ils utilisent quelque chose qui existe ?

Aucun SGBD existant ne permettrait de répondre à leurs besoins, que ce soit en termes de perfs ou de fonctionnalités.

bzc a écrit :

et ils utilisent un algo maison MapReduce pour l’indexation.

Map-reduce est plutôt leur système de distribution des calculs sur les données si j’ai bien compris. Ou comment répartir des opérations sur des milliers de To de données réparties sur des millions de serveurs. Ce qui doit servir pour tout, de l’indexation à la recherche en passant par le datamining de nos données persos.

Alpha Centauri

Le 04/03/2013 à 10h 54

#28

tazvld a écrit :

De même, je me demande bien comment en moins de 0.5sec, ils arrivent à interroger stratégiquement leur base de donnée. Mon ordi pédale pour faire moins bien et portant les dossiers sont indexés

Il faudrait rechercher où cela est dit mais à ma connaissance, google stocke son index sur la ram pour accélérer la recherche (à voir si c’est encore d’actualité avec les ssd)

Et si tu fais du mirroring sur des grappes de servers (ie de ram), ben ça va encore plus vite…

Par contre, faut pas demander le nombre de machines qu’ils ont… " />

Le 04/03/2013 à 11h 00

#29

bzc a écrit :

Tout ça n’étant évidemment pas sous GPL … et on dit que Google promeut le l’OpenSource … (Comment ça c’est pas vendredi ?)

Je ne vois pas en quoi garder secrètes les technos de leur coeur de métier, tout en finançant/participant de nombreux projets OS, revient à dire que Google ne promeut pas l’OS…

Le 04/03/2013 à 11h 05

#30

NiCr a écrit :

Je ne vois pas en quoi garder secrètes les technos de leur coeur de métier, tout en finançant/participant de nombreux projets OS, revient à dire que Google ne promeut pas l’OS…

C’était un petit troll mignon, t’es tombé dedans " />

Si non pour les serveurs il me semble que c’était dans l’ordre des centaines de milliers et pas millions non ?

zaknaster

Le 04/03/2013 à 11h 10

#31

RaYz a écrit :

C’était un petit troll mignon, t’es tombé dedans " />

Si non pour les serveurs il me semble que c’était dans l’ordre des centaines de milliers et pas millions non ?

On sait pas trop … Il y a des sources qui disent que ça a dépassé le million, tiens il y a cette infographie marrante : http://www.kinox-fr.com/images/internet/Serveurs-web-Google.png

jinge

Le 04/03/2013 à 11h 33

#32

C’est toujours ce temps de réponse qui m’a impressionné: comment traiter toutes ces données aussi rapidement?

Lolipop

Le 04/03/2013 à 11h 34

#33

Ce qui fait tourner la tête, c’est quand on se dit qu’il y a youtube aussi.

razcrambl3r

Le 04/03/2013 à 12h 19

#34

phi1981 a écrit :

30 Trillions de pages webs pour un index de 100 000 To.

…. ça fait beaucoup de données par page web.

3Mo par page environ, je ne trouve pas ça délirant (voila pourquoi je met autant de temps pour afficher une page en EDGE " /> )" />

Anonyme

Le 04/03/2013 à 12h 41

#35

bzc a écrit :

C’est du maison.

Ils ne communiquent pas énormément sur les détails mais si tu veux faire quelques recherches ils utilisent un DBMS maison nommé BigData sur un FileSystem maison GFS, et ils utilisent un algo maison MapReduce pour l’indexation.

Tout ça n’étant évidemment pas sous GPL … et on dit que Google promeut le l’OpenSource … (Comment ça c’est pas vendredi ?)

Toi t’as pas compris grand chose sur l’open source/libre apparement

yeti4

Le 04/03/2013 à 12h 59

#36

jinge a écrit :

C’est toujours ce temps de réponse qui m’a impressionné: comment traiter toutes ces données aussi rapidement?

salut

on se dit : que “Google” pourrait prendre son temps (3..4 sec.), ET nous donner

des liens plus en rapport avec la requete demandée !

(parce-que, c’est vraiment “Général” le résultat, excépté la “Rech. avancée”)" />

Le 04/03/2013 à 13h 06

#37

jinge a écrit :

C’est toujours ce temps de réponse qui m’a impressionné: comment traiter toutes ces données aussi rapidement?

Comment arrives-tu à trouver en dix secondes le mot qui t”intéresse dans un dictionnaire de 10k mots ? L’ordonnancement, les tables des matières, etcétéra, ce sont les mêmes concepts qui sont employés par les logiciels.

Attention : porno pour geek détaillant la structure de l’index de Google.

mononokehime a écrit :

Quand on y pense c’est quand meme la folie, Google télécharge littéralement internet pour faire son indexation, pas juste une ou deux pages par ci par la, Internet dans sa globalité, et les 100 000to c’est juste pour l’indexation, brrrrrrr

En fait les indexes textuels ont tendance à peser très lourd, souvent pas très loin de la taille du contenu indexé lui-même.

tazvld a écrit :

De même, je me demande bien comment en moins de 0.5sec, ils arrivent à interroger stratégiquement leur base de donnée. Mon ordi pédale pour faire moins bien et portant les dossiers sont indexés

La différence est que MS a sans doute cherché à utiliser le moins d’espace disque possible quand Google a privilégié la vitesse. Ça et le fait que beaucoup de données doivent être en mémoire.

bl78

Le 04/03/2013 à 13h 32

#38

yeti4 a écrit :

salut

on se dit : que “Google” pourrait prendre son temps (3..4 sec.), ET nous donner

des liens plus en rapport avec la requete demandée !

(parce-que, c’est vraiment “Général” le résultat, excépté la “Rech. avancée”)" />

100% d’accord ! Surtout depuis la disparition de la recherche avancée, justement ! Avant on pouvait très facilement mettre un ‘+’ devant un terme qu’on voulait absolument trouver dans les résultats, un ‘-’ pour un à ignorer au contraire, des parenthèses et “OR” pour proposer des alternatives, c’était simple et efficace !

Mais ça, c’était avant “Google+”, à cause du ‘+’ justement ils ont viré tout ça pour revenir à de la recherche de base, bête et méchante, qui retourne quarante-douze mille résultats au milieu desquels se trouvent peut-être ceux qui t’intéressent… :-( Trop bête !!

WereWindle

Le 04/03/2013 à 13h 52

#39

blaigle a écrit :

100% d’accord ! Surtout depuis la disparition de la recherche avancée,

pas de quoi

pas disparition, relégation loin des yeux de la majorité des utilisateurs qui ne l’utilisait pas, plutôt (même si les raccourci + OR, AND etc sont bien pratiques… comme tu le dis, l’apparition de caractères non-alphanumériques dans les noms est une plaie)

Le 04/03/2013 à 13h 53

#40

blaigle a écrit :

100% d’accord ! Surtout depuis la disparition de la recherche avancée

http://www.google.fr/advanced_search

" />" />

Mihashi Abonné

Le 04/03/2013 à 14h 09

#41

Lorsque vous saisissez une requête, Google va d’abord se servir d’algorithmes maison afin de mieux comprendre votre demande (autocomplétion, correction orthographique, étude des synonymes, etc.).

Rah qu’est-ce que je déteste ça qu’il corrige automatiquement sans demander ton avis " /> !

Du coup il m’arrive souvent d’avoir des résultats sans aucun rapport avec ce que je recherche. Un exemple bidon (référence à la news de 14:44 " />), je cherche des étais en solde, il me sort ça : https://www.google.fr/search?q=solde+étai (et cliquer sur “Essayez avec l’orthographe solde étai” donne le même genre de résultats avec juste “été” qui n’est plus mis en gras " /> ).

Le 04/03/2013 à 14h 56

#42

HarmattanBlow a écrit :

Comment arrives-tu à trouver en dix secondes le mot qui t”intéresse dans un dictionnaire de 10k mots ? L’ordonnancement, les tables des matières, etcétéra, ce sont les mêmes concepts qui sont employés par les logiciels.

.

Ici on ne parle pas de 10k mots mais beaucoup plus dans la mesure où il faut prendre chaque langue + les mots qui n’existent pas/sont pal orthographiés…

Chacun de ces mots renvoie plusieurs centaines de millions de résultats, et croiser c’est bien ces opérations que je trouve hallucinantes.

Qu’il y ait des index ou non, le nombre de résultats fait que la recherche devrait être plus longue (sauf que non " /> )

Le 04/03/2013 à 16h 15

#43

jinge a écrit :

Ici on ne parle pas de 10k mots mais beaucoup plus dans la mesure où il faut prendre chaque langue + les mots qui n’existent pas/sont pal orthographiés…

Chacun de ces mots renvoie plusieurs centaines de millions de résultats, et croiser c’est bien ces opérations que je trouve hallucinantes.

Qu’il y ait des index ou non, le nombre de résultats fait que la recherche devrait être plus longue (sauf que non " /> )

C’est évidemment de la simplification à outrance, mais en gros si tu as 50 feuilles et que tu veux savoir le plus rapidement possible dans quel page est le mot X, tu demandes à 50 amis de lire chacun une feuille et te donner les feuilles qui ont ce mot X.

C’est le même processus de parallélisation (ses amis sont des centaines de milliers de serveurs) qu’utilise Google, couplé avec de l’indexation , du cache (avec des chiffres au hasard je dirais que les les ³⁄₄ de tes requêtes font parties des 15% des requêtes les plus demandés donc pas besoin de recalculcer à chaque fois, au moins pour ces requêtes).

tiranor

Le 04/03/2013 à 16h 40

#44

razcrambl3r a écrit :

3Mo par page environ, je ne trouve pas ça délirant (voila pourquoi je met autant de temps pour afficher une page en EDGE " /> )" />

Euh, chez moi ça fait 3ko par page " /> " />

Le 04/03/2013 à 17h 26

#45

NiCr a écrit :

http://www.google.fr/advanced_search

" />" />

Ah, MERCI, ça me manquait bien, ça. Pas la panacée, mais bien pratique tout de même !

" /> " />

Car ce n’est PLUS accessible depuis la page par défaut… " />

Le 04/03/2013 à 17h 54

#46

jinge a écrit :

Ici on ne parle pas de 10k mots mais beaucoup plus dans la mesure où il faut prendre chaque langue + les mots qui n’existent pas/sont pal orthographiés…

Chacun de ces mots renvoie plusieurs centaines de millions de résultats, et croiser c’est bien ces opérations que je trouve hallucinantes.

Qu’il y ait des index ou non, le nombre de résultats fait que la recherche devrait être plus longue (sauf que non " /> )

Voilà comment faire un Google. Ce n’est sans doute pas le fonctionnement de Google mais il y a nécessairement des simililtudes.

Disons qu’il y a un million de mots enregistré par Google. Le serveur sur lequel tu débarques n’a donc besoin que d’un index (appelons-le index d’entrée) de quelques dizaines voire centaines de méga-octets pour connaître pour chaque mot les serveurs qui possèdent les listes de sites contenant ce mot (l’index “mot”). Autrement ce petit index d’entrée suffit à dire quel ordinateur contient les quelques ko ou Mo de l’index “mot” parmi les centaines de milliers de To stockés sur les millions de serveurs.

Jusque là c’est un jeu d’enfants (si on oublie la redondance, la résistance aux pannes, le correction d’erreurs dans la requête, les synonymes, les sens multiples pour un mot, l’identification du sens correct en fonction de tes recherches habituelles, etc). Afficher les pages par pertinence n’est pas beaucoup plus difficile car cela a été fait au préalable : l’index “mot” contient déjà toutes les pages triées par pertinence pour ce mot et si tu souhaites la troisième page il est aisé de récupérer les numéros 30 à 40 sans avoir à lire ce qui précède. Et comme personne les résultats mal notés sont très rarement, chaque serveur pour les indexes “mot” contient 99% de données rarement demandées, on pourra donc garder le 1% important en mémoire..

Maintenant le cas des requêtes à plusieurs mots est plus délicat : pour chaque mot il peut y avoir des millions de pages. Pour chacune il ne nous faut qu’un identifiant de 16 octets (et quelques autres infos pour le tri mais ce n’est que tout à la fin, une fois les dix pages retenues sélectionnées, qu’on requiérera les url). Considérons une requête à deux mots avec un million de résultats chacun. Deux solutions naïves pour comprendre la vraie solution expliquée plus loin :

* Récupérer les millions de page triées par leur identifiant. Le croisement est alors simple (l’affaire de quelques ms) mais on se retrouverait avec de très nombreux résultats à trier et, là, on explose le budget CPU.

* Récupérer les millions de pages triées par note. Le problème est alors inversé, c’est le croisement qui est hors-budget.

En réalité plusieurs éléments de solutions à ça :

* On mélange les deux solutions naïves, ce qui fait qu’il faut deux index “mot” par mot, triés différemment.

* Au lieu de s’embêter à rapatrier des millions de pages, on triche sur le tri. Par exemple on considère que les 100 premières pages sont constituées des 50 premières du premier mot et des 50 suivantes du second mot. Du coup on ne rapatrie que très peu de données et le croisement puis le tri sont un jeu d’enfants. La mémoire, la bande passante réseau, le CPU et le disque dur du serveur “mot” sont épargnés et le résultat est bon pour l’utilisateur, vraisemblablement proche du résultat exact.

* En plus de l’index d’entrée il faut un autre index donnant les mots qui suivent généralement. Ces séquences doivent être traitées comme des mots en eux-mêmes avec leurs propres index “mot”. On enregistre donc un index “mot” pour “hymne à la joie” contenant toutes les pages avec cette séquence de mots. Ainsi on pourra obtenir une meilleure pertinence pour “hymne à la joie” qu’en combinant “hymne” et “joie”.

Et j’en passe et des meilleures, notamment tout l’aspect du tri des résultats finaux en fonction du profil de l’utilisateur.

linkin623 Abonné

Le 05/03/2013 à 05h 14

#47

bzc a écrit :

C’est évidemment de la simplification à outrance, mais en gros si tu as 50 feuilles et que tu veux savoir le plus rapidement possible dans quel page est le mot X, tu demandes à 50 amis de lire chacun une feuille et te donner les feuilles qui ont ce mot X.

C’est le même processus de parallélisation (ses amis sont des centaines de milliers de serveurs) qu’utilise Google, couplé avec de l’indexation , du cache (avec des chiffres au hasard je dirais que les les 90% de tes requêtes font parties des 5% des requêtes les plus demandés donc pas besoin de recalculcer à chaque fois, au moins pour ces requêtes).

" />

Google est devenu un fournisseur d’url pour les noobs…

Dans l’ordre :

google.fr (oui des gens tape google dans la barre de recherche " />)

facebook.com

twitter.com

[insérerez un site très connu]

josagama

Le 05/03/2013 à 08h 00

#48

30 000 milliards de pages

C’est l’équivelent du gouvernement pour la lutte contre le chomage " />

Le 05/03/2013 à 11h 36

#49

tiranor a écrit :

Euh, chez moi ça fait 3ko par page " /> " />

Ah oui en effet, Oups, pourtant j’m’étais déja retourné le cerveau pour arriver à ça " />

Superambre

Le 06/03/2013 à 08h 08

#50

ce qui m’impressionne c’est qu’en France on est pas foutu de faire un moteur semblable ?

me dites pas que tous les mathématicien/analystes de la Terre sont chez Google ?

bon ils ont aussi peut être autre chose à faire mais c’est extraordinairement important !

anonyme_b3e05f43bed326da32611ec4ad59c217

Le 06/03/2013 à 08h 31

#51

Superambre a écrit :

ce qui m’impressionne c’est qu’en France on est pas foutu de faire un moteur semblable ?

me dites pas que tous les mathématicien/analystes de la Terre sont chez Google ?

bon ils ont aussi peut être autre chose à faire mais c’est extraordinairement important !

Y a surtout que pour concurrencer Google, il va falloir dépenser des sommes considérables.

Le 06/03/2013 à 09h 21

#52

non je ne pense pas, bien au contraire, il suffit du moteur de recherche, après c’est comme google , avec le fric de la pub tu mets + de serveurs etc

enfin techniquement je vois ça comme ça, mais plus la partie politique qu’il faudrait développer

Google : d’une recherche aux résultats, en passant par un index de 100 000 To

30 000 milliards de pages et moi, et moi et moi...

Tiens, en parlant de ça :

Les recommandations de la NSA pour « déployer des systèmes d’IA en toute sécurité »

NSA.I

EUCS : la certification cloud européenne sous le feu des critiques en France

Chiens de faïence

L’Institut des normes de télécommunication de l’UE (ETSI) défie la Commission européenne

Irréductible gaulois, #oupas

Sommaire de l'article

Introduction

Les recommandations de la NSA pour « déployer des systèmes d’IA en toute sécurité »

#LeBrief : Windows Store amélioré, 28 licenciements chez Google, sécurité des données des français, compétition 404CTF

EUCS : la certification cloud européenne sous le feu des critiques en France

L’Institut des normes de télécommunication de l’UE (ETSI) défie la Commission européenne

Le « payer ou accepter » de Meta incompatible avec le RGPD pour le CEPD

Le CERN libère les données de la découverte du boson de Higgs

Le ministère de l’Intérieur mise sur l’américain TRM Labs pour traquer les flux illégaux de cryptos

#LeBrief : spectre du gamergate, TikTok Lite sous pression, Freebox Ultra vs Deus Ex Silicium, Pegasus en Pologne

Le Slip français se fait trouer : 1,5 million d’emails et des données de 696 144 clients dérobés ?

Après l’affaire XZ Utils, la sécurité des projets open source en question

Samsung dépasse les 10 Gb/s avec sa mémoire LPDDR5X

Élections européennes : Meta échoue à modérer des publicités de propagande pro-russe

#LeBrief : fuite chez le Slip Français, YouTube et les antipubs, Firefox 125, délit pour les deepfakes, trou noir « dormant »

VMware by Broadcom : une situation tendue, l’Europe s’en mêle

Comment la désinformation d’extrême-droite sert les intérêts russes en France

Mars Sample : retour pas si sûr…

#LeBrief : « traumatisme » du deepfake pornographique, Tesla licencie, Samsung repasse devant Apple, Musk vs finances X

Aux USA, la surveillance des communications d’étrangers sans mandat (FISA) fait débat

Apple autorise puis supprime un émulateur Game Boy sur iOS

Android 15 bêta : Wallet par défaut, sécurité des réseaux mobiles et Wi-Fi, bugs sur le NFC

Rapidité vs précision : deux experts nous expliquent les enjeux des GPU modernes sur les IA

#LeBrief : Beeper rachetée, Cyber Command USA, incident technique BFMTV, « destin énergétique » de l’Europe

#Flock : de Game of Shithrones au jeu des sept différences