Abonnez-vous Connexion

Abonnez-vous

Nous suivre

À propos

Next, média indépendant, est soutenu par la société moji.

Elle lui assure une pérennité économique et lui permet de maintenir sa totale liberté éditoriale, d'expérimenter de nouvelles formes d'information et de garantir sa survie à long terme, sans dépendre d'annonceurs externes.

Droit d’auteur : la SAIF insiste sur la taxation de Google Images

Et SAIF quêta

Marc Rees

Publié dans

15/04/2014 4 minutes

Dans le cadre d’une consultation sur le droit d’auteur en Europe, La Société des auteurs des arts visuels et de l'image fixe (SAIF) a relancé la question des images utilisées par les moteurs de recherche.

Dans sa consultation visant à déterminer s’il est utile de dépoussiérer le droit d’auteur, la Commission européenne expose la problématique juridique du lien internet. Il s’agit spécialement de savoir si un lien créé vers une œuvre doit ou non être soumis à autorisation préalable des ayants droit.

Pour la SAIF, cela ne fait pas de doute : « Un lien hypertexte de renvoi vers une oeuvre localisée sur un autre site constitue un acte de communication au public. Il doit, selon nous, faire l’objet d’une autorisation d’exploitation ». La société de gestion collective ajoute que cette autorisation est d’autant plus nécessaire « si le lien est constitué par un pointeur reproduisant l’œuvre elle-même (moteur de recherche d’images). »

Juste rémunération

Sur ce terrain, la société de perception et de répartition des droits insiste bien : « Dès lors qu’une œuvre, par exemple une image sert de pointeur, cette utilisation de l’œuvre doit être autorisée, car il s’agit d’une exploitation de l’œuvre elle-même et non plus d’un simple lien renvoyant l’internaute vers un site tiers qui pourrait la reproduire et communiquer au public sur l’une de ses pages l’image en question ». Elle cite alors l’exemple des moteurs de recherche d’images comme Google Images qui « ne se contente pas de renvoyer sur le site tiers, [mais] affiche l’image en totalité sur sa propre page de résultat en dehors de son contexte d’origine et permet de l’afficher en grand format ».

Dans ce cadre, poursuivent les ayants droit, « l’opérateur réalise une exploitation autonome des œuvres et en retire un avantage économique significatif », alors même que Google Images n'affiche aucune pub sur ces pages. Celle-ci conclut en conséquence que « de tels actes doivent faire l’objet d’une juste rémunération des ayants droit. »

Un écho à la proposition de loi de Philippe Marini

Ce débat posé devant la Commission européenne reprend les termes déjà exposés en France. Philippe Marini, sénateur et président de la Commission des Finances, a déposé la semaine dernière une proposition de loi visant à exiger des moteurs d’images une contribution au profit des sociétés de gestion collective. Le sénateur UMP veut ainsi soumettre ces utilisations à rémunération dès lors que les Google Images et autres référencent des contenus sous droit d’auteur « Selon ce dispositif, tout éditeur de moteur de recherche sera soumis à des obligations déclaratives et de reversements selon des barèmes fixés par convention ou par une commission paritaire » expose le parlementaire.

La mesure, qui avait déjà été imaginée au Conseil supérieur de la propriété littéraire et artistique, entre les murs du ministère de la Culture, évite difficilement les critiques liées à son aspect usine à gaz : selon Marini, les moteurs seraient en effet tenus de « fournir aux sociétés agréées le relevé des exploitations des œuvres et toutes informations nécessaires à la répartition des sommes perçues aux auteurs ou leurs ayants droit ». On imagine en effet sans mal l’ampleur du chantier s’il s’agissait pour Google de retracer l’usage des millions d’images référencées.

Rappelons enfin que la SAIF avait indiqué qu’il était hors de question pour les auteurs d’utiliser le fichier Robots.txt, lequel permet d’exclure du référencement les contenus hébergés sur un site. Google est « responsable du contenu qu’elle met à la disposition du public. Par conséquent [la société] ne peut pas se contenter de renverser la charge de la responsabilité en imposant aux sites d’origine d’indiquer s’ils souhaitent être référencés sur son moteur de recherche. » Bref, les créateurs doivent être référencés et les moteurs doivent payer.

Écrit par Marc Rees

Tiens, en parlant de ça :

[Édito] Au pays des VPN menteurs…

Article sponsorisé par les lecteurs de Next

17:26 28

Un ordinateur avec un drapeau pirate sur fond rouge

Les clients LastPass victimes d’une attaque par phishing orchestrée grâce à un kit clé en main

Le progrès <3

16:53 10

Les recommandations de la NSA pour « déployer des systèmes d’IA en toute sécurité »

NSA.I

09:48 4

Sommaire de l'article

Introduction

Juste rémunération

Un écho à la proposition de loi de Philippe Marini

[Édito] Au pays des VPN menteurs…

Les clients LastPass victimes d’une attaque par phishing orchestrée grâce à un kit clé en main

Les recommandations de la NSA pour « déployer des systèmes d’IA en toute sécurité »

#LeBrief : Windows Store amélioré, 28 licenciements chez Google, sécurité des données des français, compétition 404CTF

EUCS : la certification cloud européenne sous le feu des critiques en France

L’Institut des normes de télécommunication de l’UE (ETSI) défie la Commission européenne

Le « payer ou accepter » de Meta incompatible avec le RGPD pour le CEPD

Le CERN libère les données de la découverte du boson de Higgs

Le ministère de l’Intérieur mise sur l’américain TRM Labs pour traquer les flux illégaux de cryptos

#LeBrief : spectre du gamergate, TikTok Lite sous pression, Freebox Ultra vs Deus Ex Silicium, Pegasus en Pologne

Le Slip français se fait trouer : 1,5 million d’emails et des données de 696 144 clients dérobés ?

Après l’affaire XZ Utils, la sécurité des projets open source en question

Samsung dépasse les 10 Gb/s avec sa mémoire LPDDR5X

Élections européennes : Meta échoue à modérer des publicités de propagande pro-russe

#LeBrief : fuite chez le Slip Français, YouTube et les antipubs, Firefox 125, délit pour les deepfakes, trou noir « dormant »

VMware by Broadcom : une situation tendue, l’Europe s’en mêle

Comment la désinformation d’extrême-droite sert les intérêts russes en France

Mars Sample : retour pas si sûr…

#LeBrief : « traumatisme » du deepfake pornographique, Tesla licencie, Samsung repasse devant Apple, Musk vs finances X

La Section 702 de la loi sur la surveillance du renseignement étranger (Foreign Intelligence Surveillance Act – FISA)

Aux USA, la surveillance des communications d’étrangers sans mandat (FISA) fait débat

Apple autorise puis supprime un émulateur Game Boy sur iOS

Android 15 bêta : Wallet par défaut, sécurité des réseaux mobiles et Wi-Fi, bugs sur le NFC

Rapidité vs précision : deux experts nous expliquent les enjeux des GPU modernes sur les IA

#LeBrief : Beeper rachetée, Cyber Command USA, incident technique BFMTV, « destin énergétique » de l’Europe

Le Brief ne travaille pas le week-end.
C'est dur, mais c'est comme ça.
Allez donc dans une forêt lointaine,
Éloignez-vous de ce clavier pour une fois !

Fermer

❮

❯

Commentaires (106)

Dez

Le 15/04/2014 à 08h 09

Oui bien sûr, essayons d’utiliser internet sans moteur de recherche.

Sont malins eux.

In fine, ça revient à ça leur raisonnement…

Cara62

Le 15/04/2014 à 08h 15

Dez a écrit :

Oui bien sûr, essayons d’utiliser internet sans moteur de recherche.

Sont malins eux.

In fine, ça revient à ça leur raisonnement…

Facile tu tapes une URL au hasard. " />

Bug

Le 15/04/2014 à 08h 15

Un lien hypertexte de renvoi vers une oeuvre localisée sur un autre site constitue un acte de communication au public. Il doit, selon nous, faire l’objet d’une autorisation d’exploitation

Pardon Mr l’Artiste, je peux mettre un lien vers votre site ?

Oui, c’est 1€

VTFF " />

knos

Le 15/04/2014 à 08h 16

robot.txt …

S’ils ne veulent pas que google référence leurs images.

A moins qu’ils veulent être référencé et payer en plus…

Alucard63

Le 15/04/2014 à 08h 16

Droit d’auteur : la SAIF insiste sur la taxation de Google Images

:facepalm:

Bug

Le 15/04/2014 à 08h 22

knos a écrit :

robot.txt …

S’ils ne veulent pas que google référence leurs images.

A moins qu’ils veulent être référencé et payer en plus…

Toi t’as pas lu la news jusqu’au bout " />

knos

Le 15/04/2014 à 08h 25

Bug a écrit :

Toi t’as pas lu la news jusqu’au bout " />

Non mais ça confirme ce que j’ai dis " /> . Ils veulent les deux. Profiter du service et ce faire payer pour.

Bug

Le 15/04/2014 à 08h 26

knos a écrit :

Non mais ça confirme ce que j’ai dis " /> . Ils veulent les deux. Profiter du service et ce faire payer pour.

Ouai, exactement ce que demandaient les éditeurs de presse.

Esarend

Le 15/04/2014 à 08h 27

Passage en liste blanche pour tous les sites “d’artiste” qui réclament du pognon (il faut bien qu’ils se manifestent à un moment donné pour toucher leur rente, donc on peut générer une liste) : le robot.txt ne servira pas alors à indiquer une demande de non-référencement, mais à ce moment là une spécification d’acceptation de référencement. Ca devrait en calmer qq uns.

atomusk

Le 15/04/2014 à 08h 28

#10

L’alternative serait que Google renverse le fonctionnement : !Robot.txt SI tu veux être référencé " />

Mais bon, c’est un coup à perdre 99% des images de google image " />

Niktareum

Le 15/04/2014 à 08h 28

#11

Un moteur de recherche d’images… Sans images…

Un moteur de recherche de quoi ?

Un moteur de quoi ?

Internet, c’est quoi ?

Je demande le retour de Lycos, des sites persos Infonie et de napster !!!

trash54

Le 15/04/2014 à 08h 28

#12

exclusif le résultât des futurs recherches d’images

ici

" />

[edit Atomusk : fixed]

knos

Le 15/04/2014 à 08h 30

#13

Bug a écrit :

Ouai, exactement ce que demandaient les éditeurs de presse.

Et comme je le dis a chaque foi google devrait prendre le problème dans l’autre sens. (en tout cas sur Gnews et images).

A ceux qui veulent être référencé de s’inscrire. Et dommage pour les autres. Ainsi tu passerai par une CGU

Arnaud3013 Abonné

Le 15/04/2014 à 08h 32

#14

J’ai pas compris le sous-titre, une âme charitable pour m’éclairer ?

knos

Le 15/04/2014 à 08h 33

#15

Arnaud3013 a écrit :

J’ai pas compris le sous-titre, une âme charitable pour m’éclairer ?

etc? pas compris non plus

anonyme_751eb151a3e6ce065481d43bf0d18298

Le 15/04/2014 à 08h 33

#16

Intéressant ce concept…

Faire payer la mise à disposition d’un service.

Espérons que ça passe, on va pouvoir quémander aux réseaux sociaux pour référencer nos profils publics.

anonyme_751eb151a3e6ce065481d43bf0d18298

Le 15/04/2014 à 08h 34

#17

Arnaud3013 a écrit :

J’ai pas compris le sous-titre, une âme charitable pour m’éclairer ?

Salif Keita " />

Bourrique

Le 15/04/2014 à 08h 35

#18

knos a écrit :

robot.txt …

S’ils ne veulent pas que google référence leurs images.

A moins qu’ils veulent être référencé et payer en plus…

C’est le concept de base. Et en plus ca marche relativement bien. " />

Mr google, t’as l’autorisation de voir le répertoire public (et de m’envoyer des visteurs, merci)

Pour le répertoire private, comme son nom l’indique, mr google tu reste à la porte et on sera bon amis.

Mais bon encore des qui veulent, les épinard, le beurre, l’argent du beurre, le cul de la crémière et de la fermière, ainsi que les subventions de la PACS. " />

Comme d’habitude, quoi. " />

J’aimerais qu’un jour googl prenne au mot les revendications farfelus de nos politique et déréférence le contenu français de la toile. " />

" /> ou pas " />

ActionFighter a écrit :

Espérons que ça passe, on va pouvoir quémander aux réseaux sociaux pour référencer nos profils publics.

Oh oui, Oh oui " />

Jean_Peuplus

Le 15/04/2014 à 08h 41

#19

Dommage qu’il n’y ait pas une loi contre la stupidité, on pourrait les assigner en justice pour les forcer à réfléchir un peu.

Jean_Peuplus

Le 15/04/2014 à 08h 43

#20

Niktareum a écrit :

Je demande le retour de Lycos, des sites persos Infonie et de napster !!!

Et altavista " />

anonyme_751eb151a3e6ce065481d43bf0d18298

Le 15/04/2014 à 08h 45

#21

Niktareum a écrit :

Je demande le retour de Lycos, des sites persos Infonie et de napster !!!

Et des forfaits AOL ? " />

Alucard63

Le 15/04/2014 à 08h 48

#22

trash54 a écrit :

exclusif le résultât des futurs recherches d’images

ici

" />

[edit Atomusk : fixed]

Attention on risque de te coller un procès pour utilisation sans accord du créateur de l’œuvre “Page blanche sur fond blanc”." />

ActionFighter a écrit :

Et des forfaits AOL ? " />

Surtout le son à la connexion…" />

Jean_Peuplus

Le 15/04/2014 à 08h 53

#23

Alucard63 a écrit :

Attention on risque de te coller un procès pour utilisation sans accord du créateur de l’œuvre “Page blanche sur fond blanc”." />

Non c’est Whiteman qui va pouvoir porter plainte " />

official&channel=sb&tbm=isch&tbo=u&source=univ&sa=X&ei=afNMU4fiE4f_OZDDgcgH&ved=0CDIQsAQ&biw=1680&bih=912” target=”_blank” rel=“nofollow”>lien

cyrilleberger

Le 15/04/2014 à 08h 54

#24

Le problème c’est que google image ne se contente pas d’indexer:

google image ne se contente pas de renvoyer sur le site tiers, [mais] affiche l’image en totalité sur sa propre page de résultat en dehors de son contexte d’origine et permet de l’afficher en grand format

Si Google image se contentait d’afficher une vignette, et que pour voir l’image en grand tu dois aller sur le site, il n’y aurait pas lieu de se plaindre. Mais la, google abuse.

knos

Le 15/04/2014 à 08h 57

#25

cyrilleberger a écrit :

Le problème c’est que google image ne se contente pas d’indexer:

Si Google image se contentait d’afficher une vignette, et que pour voir l’image en grand tu dois aller sur le site, il n’y aurait pas lieu de se plaindre. Mais la, google abuse.

Pourtant chez moi ca ce passe comme ca. Quand tu veux la voir en grand tu la vois extraite du site mais avec le site en font.

Jean_Peuplus

Le 15/04/2014 à 08h 57

#26

cyrilleberger a écrit :

Si Google image se contentait d’afficher une vignette, et que pour voir l’image en grand tu dois aller sur le site, il n’y aurait pas lieu de se plaindre. Mais la, google abuse.

C’est ce qu’il se passe non ?

CryoGen

Le 15/04/2014 à 08h 58

#27

C’est marrant tout de même. Je veux avoir de la visibilité : donc je fourni des visuels m’appartenant à une société de marketing qui va en faire des publicités contre des espèces sonnantes et trébuchantes…

Ici j’ai de la visibilité gratuite " /> vite ils me doivent du pognon " /> , trop dur d’ajouter un fichier gratuit pour empêcher ce pillage… par contre mon compte adsense est à renouveler ce mois ci….

Bravo " />

anonyme_751eb151a3e6ce065481d43bf0d18298

Le 15/04/2014 à 08h 58

#28

Alucard63 a écrit :

Surtout le son à la connexion…" />

Coupes moi ça ! Je suis au téléphone avec ta grand-mère !

cid_Dileezer_geek

Le 15/04/2014 à 09h 00

#29

Que tout les ayants droits lèvent le doigt…. OK, maintenant placez vous en file contre le mur… bien bien, présentez armes, FEU…problem solved. " />

roswell51

Le 15/04/2014 à 09h 18

#30

De toute façon le fonctionnement actuel est le suivant:

-Vous avez des sous dans la caisse pour qu’on s’engraisse ?

-Non chef on en a plus

-Trouvez moi des sous

-Oui chef, on peux faire tourner la planche à billet ?

-Ben non sinon j’aurai plein de billets qui valent que dalle

-Que fait on chef ?

-Trouvez Volez le pognon là où il est

-Ok allons voir les grandes entreprises françaises

-Ha non non lobbying tous ça

-Ok chef bon ben Google, les frontaliers, la classe moyenne, Amazon, … on peux ?

-Oui oui on inventera une loi par la suite pour le justifier

yvo2m

Le 15/04/2014 à 09h 26

#31

Esarend a écrit :

Passage en liste blanche pour tous les sites “d’artiste” qui réclament du pognon (il faut bien qu’ils se manifestent à un moment donné pour toucher leur rente, donc on peut générer une liste) : le robot.txt ne servira pas alors à indiquer une demande de non-référencement, mais à ce moment là une spécification d’acceptation de référencement. Ça devrait en calmer qq uns.

Parfait !

Je peux comprendre leur argument du “ce n’est pas à moi de dire que je ne veux pas être référencé”, car Google prend le droit d’indexer sans demander l’avis (m’enfin c’est le principe du web aussi).

Mais créer la liste des ayant droits qui demandent de l’argent est nécessaire … et permet dans le même temps de les déférencer " />

malock

Le 15/04/2014 à 09h 26

#32

Des questions peut-être un peu nazes… j’y connais que dalle…

C’ est normé les “Robots.txt” ? C’est seulement utilisé par/pour Google ou ça concerne également les autres moteurs de recherche ?

Ceux qui souhaitent créer un nouveau moteur de recherche sont-ils obligés de prendre en charge les Robots.txt ?

Khalev

Le 15/04/2014 à 09h 30

#33

cyrilleberger a écrit :

Le problème c’est que google image ne se contente pas d’indexer:

Si Google image se contentait d’afficher une vignette, et que pour voir l’image en grand tu dois aller sur le site, il n’y aurait pas lieu de se plaindre. Mais la, google abuse.

Le grand format provient directement du site. Pas de Google. C’est pas la faute de Google si les sites laissent les images être référencées sans interdire le référencement du dossier images dans robot.txt.

knos

Le 15/04/2014 à 09h 31

#34

malock a écrit :

Des question peut-être un peu nazes… j’y connais que dalle…

C’ est normé les “Robots.txt” ? C’est seulement utilisé par/pour Google ou ça concerne également les autres moteurs de recherche ?

Ceux qui souhaitent créer un nouveau moteur de recherche sont-ils obligés de prendre en charge les Robots.txt ?

Normalement c’est une norme commune. Après tu ne peu pas empêcher un robot qui ne respecte pas la règle que ne pas en tenir compte. Mais tout les moteurs de recherche respectable le suive.

Khalev

Le 15/04/2014 à 09h 33

#35

malock a écrit :

Des question peut-être un peu nazes… j’y connais que dalle…

C’ est normé les “Robots.txt” ? C’est seulement utilisé par/pour Google ou ça concerne également les autres moteurs de recherche ?

Ceux qui souhaitent créer un nouveau moteur de recherche sont-ils obligés de prendre en charge les Robots.txt ?

C’est pour tous les “crawlers” qui veulent bien suivre ce qui est marqué dans le robots.txt.

Il n’y a aucune contrainte technique à appliquer les règles de robots.txt c’est purement une question de confiance.

Si tu crées un nouveau crawler tu peux tout à fait suivre les règles que tu veux, en général sur les miens je respecte les même règles que celui de Google puisque c’est celui qui est le plus présent. (mais pas tout le temps " />, en même temps c’est juste pour mon utilisation perso)

v1nce

Le 15/04/2014 à 09h 38

#36

Jean_Peuplus a écrit :

C’est ce qu’il se passe non ?

Ca dépend. Actuellement sur GG images quand je clique sur une vignette moi je vois un bandeau noir avec l’image en grand format et des boutons pour naviguer vers des images de même thématique. Suffit de faire enregistrer sous (*) et tu as l’image du site référencé sans l’avoir ouvert.

Le bandeau propose 2 liens “Consulter la page” et “afficher l’image”.

Le second lien te permet d’ouvrir l’image directement sur le site (sans la page html)

* = faut attendre un peu parce qu’il commence par charger la vignette avant de charger l’image définitive

C’est pratique mais pour le site c’est pas top.

On peut accepter que GG fasse des vignettes mais quand même vouloir que les gens viennent sur le site. Et là à part bloquer les images si le referrer n’est pas son propre site je ne vois pas trop ce qu’on peut faire (et là c’est moins simple)

malock

Le 15/04/2014 à 09h 38

#37

knos a écrit :

Normalement c’est une norme commune. Après tu ne peu pas empêcher un robot qui ne respecte pas la règle que ne pas en tenir compte. Mais tout les moteurs de recherche respectable le suive.

Khalev a écrit :

C’est pour tous les “crawlers” qui veulent bien suivre ce qui est marqué dans le robots.txt.

Il n’y a aucune contrainte technique à appliquer les règles de robots.txt c’est purement une question de confiance.

Si tu crées un nouveau crawler tu peux tout à fait suivre les règles que tu veux, en général sur les miens je respecte les même règles que celui de Google puisque c’est celui qui est le plus présent. (mais pas tout le temps " />, en même temps c’est juste pour mon utilisation perso)

Ok. Merci. J’ignorais même totalement le mot “crawlers”…

Du coup, ça m’a permis de visiter rapidement wikipédia et il y est indiqué que c’est par “convention” que les moteurs de recherche débutent par lire le fichier robots.txt.

Sans vouloir appuyer la requêtes des ayants droits, c’est tout de même “limite” de leur dire qu’il y a les robots.txt pour éviter tout ça alors qu’un moteur n’est pas dans l’obligation de le respecter…

v1nce

Le 15/04/2014 à 09h 46

#38

Khalev a écrit :

Le grand format provient directement du site. Pas de Google. C’est pas la faute de Google si les sites laissent les images être référencées sans interdire le référencement du dossier images dans robot.txt.

GG pousse un peu quand même.

Faire des vignettes des images comme on fait des extraits des news c’est OK pour moi.

Mais afficher l’image dans sa résolution maxi sans avoir à aller sur le site référencé c’est pas glop. Ce serait comme citer l’article in extenso dans GG news.

Vilainkrauko Abonné

Le 15/04/2014 à 09h 49

#39

" /> pour le sous titre ! " />

Ils veulent qui ? être payé a ne rien foutre ? " />

knos

Le 15/04/2014 à 09h 52

#40

v1nce a écrit :

GG pousse un peu quand même.

Faire des vignettes des images comme on fait des extraits des news c’est OK pour moi.

Mais afficher l’image dans sa résolution maxi sans avoir à aller sur le site référencé c’est pas glop. Ce serait comme citer l’article in extenso dans GG news.

Sauf que chez moi si je veux voir l’image en grand c’est uniquement sur le site. Ou alors j’ai raté un truc.

v1nce

Le 15/04/2014 à 09h 53

#41

malock a écrit :

Sans vouloir appuyer la requêtes des ayants droits, c’est tout de même “limite” de leur dire qu’il y a les robots.txt pour éviter tout ça alors qu’un moteur n’est pas dans l’obligation de le respecter…

Ils n’ont qu’à faire un site privé. Personne ne viendra leur indexer/piquer leurs photos.

Si leur site est public la solution c’est robots.txt.

Après faut peut-être ajouter de nouvelles directives dans robots.txt pour intégrer un droit de citation. Pas plus de x mots, résolution maxi des vignettes…

v1nce

Le 15/04/2014 à 10h 00

#42

knos a écrit :

Sauf que chez moi si je veux voir l’image en grand c’est uniquement sur le site. Ou alors j’ai raté un truc.

Ca dépend des GG image.

At home (de mémoire) je vois le site en grisé avec un bandeau vertical à droite permettant de récupérer l’image.

At work pas besoin d’aller sur le site, tu récupères l’image direct depuis GG images via un panneau qui te présente la version taille réelle de la vignette cliquée + possibilité de naviguer vers des images proches

v1nce

Le 15/04/2014 à 10h 08

#43

v1nce a écrit :

Ca dépend des GG image.

At home (de mémoire) je vois le site en grisé avec un bandeau vertical à droite permettant de récupérer l’image.

At work pas besoin d’aller sur le site, tu récupères l’image direct depuis GG images via un panneau qui te présente la version taille réelle de la vignette cliquée + possibilité de naviguer vers des images proches

Voilà ce que ça donne @work pour une recherche sur toto en cliquant sur la vignette 0 + 0 = 0

http://i62.tinypic.com/xfwxhj.jpg

CryoGen

Le 15/04/2014 à 10h 10

#44

malock a écrit :

Sans vouloir appuyer la requêtes des ayants droits, c’est tout de même “limite” de leur dire qu’il y a les robots.txt pour éviter tout ça alors qu’un moteur n’est pas dans l’obligation de le respecter…

En quoi c’est limite ? Si tu mets en place le robot.txt, tu es protégé. Tu as dit : NON. Si Google ou autre index tes images tu peux te plaindre légitimement.

Par contre, vu que le monde s’oriente sur une politique d’accord explicite (ce qui est contraire à la mentalité de départ d’Internet et le partage , avant sa commercialisation en gros) il faudrait peut-être passer sur un mode inverse et utiliser le robot.txt pour dire OUI.

v1nce a écrit :

Après faut peut-être ajouter de nouvelles directives dans robots.txt pour intégrer un droit de citation. Pas plus de x mots, résolution maxi des vignettes…

Oui, faire évoluer le robot.txt n’est pas une mauvaise idée.

Arnaud3013 Abonné

Le 15/04/2014 à 10h 21

#45

ActionFighter a écrit :

Salif Keita " />

Merci;)

cyrilleberger

Le 15/04/2014 à 10h 28

#46

Khalev a écrit :

Le grand format provient directement du site. Pas de Google. C’est pas la faute de Google si les sites laissent les images être référencées sans interdire le référencement du dossier images dans robot.txt.

C’est quand même la faute de google: si quand tu clique sur l’image dans google image, ça t’affiche l’image en grand dans le site de google, et que tu puisse de la cliquer droit et sauvegarder l’image, sans jamais avoir été visiter le site.

Au début de google image, quand tu cliquais sur l’image dans google image, ça t’envoyais directement sur le site, où tu pouvais récupérer l’image en grand.

La, c’est un peu comme si le google “web”, quand tu clique sur un résultat, au lieu de t’emmener sur la page du site, il t’affichait le texte de la page, à l’intérieur du site google. Et par exemple, en cherchant “pcinpact taxation google”, au lieu de visiter cette page, on aurait le texte de l’article et rien d’autre.

MarcRees Abonné

Le 15/04/2014 à 10h 30

#47

trash54 a écrit :

exclusif le résultât des futurs recherches d’images

ici

" />

[edit Atomusk : fixed]

RT merci ;)

Bug

Le 15/04/2014 à 10h 40

#48

knos a écrit :

Normalement c’est une norme commune. Après tu ne peu pas empêcher un robot qui ne respecte pas la règle que ne pas en tenir compte. Mais tout les moteurs de recherche respectable le suive.

Mais tu peux le bloquer avec le htaccess " />

HarmattanBlow

Le 15/04/2014 à 11h 06

#49

Rappelons enfin que la SAIF avait indiqué qu’il était hors de question pour les auteurs d’utiliser le fichier Robots.txt

Sont en lice pour le foutage de tronche d’or 2014….

Mimoza Abonné

Le 15/04/2014 à 11h 10

#50

Par conséquent [la société] ne peut pas se contenter de renverser la charge de la responsabilité en imposant aux sites d’origine d’indiquer s’ils souhaitent être référencés sur son moteur de recherche.

Sont sympa eux " />

Sur tous documents papier qu’ils publient il y a explicitement un mention de copyright ou autre, ce qui équivaut plus ou moins au robot.txt.

Donc pour les ouvrage matériel il font ce qu’il faut mais pas pour le numérique " />

Encore une bande de branquignole qui ne comprend pas la techno mais qui veux la tordre pour la faire respecter LEURS exigence sans autre considération. " />

Si au moins ils proposaient des solutions crédible, genre nouvelle norme, évolution de l’existant et pas seulement réclamer des €€€ sans rien foutre " />" />" />" />

TiTan91

Le 15/04/2014 à 11h 15

#51

knos a écrit :

Et comme je le dis a chaque foi google devrait prendre le problème dans l’autre sens. (en tout cas sur Gnews et images).

A ceux qui veulent être référencé de s’inscrire. Et dommage pour les autres. Ainsi tu passerai par une CGU

yvo2m a écrit :

Parfait !

Je peux comprendre leur argument du “ce n’est pas à moi de dire que je ne veux pas être référencé”, car Google prend le droit d’indexer sans demander l’avis (m’enfin c’est le principe du web aussi).

Mais créer la liste des ayant droits qui demandent de l’argent est nécessaire … et permet dans le même temps de les déférencer " />

CryoGen a écrit :

En quoi c’est limite ? Si tu mets en place le robot.txt, tu es protégé. Tu as dit : NON. Si Google ou autre index tes images tu peux te plaindre légitimement.

Par contre, vu que le monde s’oriente sur une politique d’accord explicite (ce qui est contraire à la mentalité de départ d’Internet et le partage , avant sa commercialisation en gros) il faudrait peut-être passer sur un mode inverse et utiliser le robot.txt pour dire OUI.

Oui, faire évoluer le robot.txt n’est pas une mauvaise idée.

sauf que changer le fonctionnement vers un accord explicite fera disparaitre des moteurs 99% du web

entre les sites qui ne sont plus maintenus à jour mais contiennent quand même du contenu intéressant, les personnes qui ont des pages perso mais sont incapables de configurer ça (et ceux la veulent etre sur google).

Au final passez à de l accord explicite serait très mauvais pour le web a mon avis, et ce serait un signal très négatif : à mon sens ça signifie que le web se ferme, que tout devient privé et que le public devient l’exception.

Après, c’est ce que souhaitent pas mal d’autorités, pour prendre le controle de cette “zone de non droit”.

Le web c’est ouvert, point !

vous voulez pas qu on se serve de vos sites, pas qu on les référence, pas qu’on y accède ? c’est à vous de les fermer !

enfin la j’ai plus l’impression qu’ils veulent pas d’une inversion de cette logique. Ils refusent juste la logique actuelle pour justifier de réclamer de l’argent. Ce seraient les premier embêtés si on passait par des accords, ils devraient disparaitre, ou accépter le référencement sans contrepartie.

Faith

Le 15/04/2014 à 11h 29

#52

TiTan91 a écrit :

sauf que changer le fonctionnement vers un accord explicite fera disparaitre des moteurs 99% du web

Il y a “accord explicite” et “accord explicite”.

Il ne peut pas y avoir d’accord explicite juste pour une indexation, ce serait effectivement mauvais pour le web (encore que, le web s’adapterait vite: de nos jour, qui héberge soi-même son site sans avoir 2 ou 3 connaissances en info ? les autres verrons leurs prestataires s’occuper du robots.txt (skyblog, etc y compris))

Mais pour la retranscription totale de photos et/ou d’articles, ce serait normal d’avoir besoin d’un accord explicite.

Un moteur de recherche peut parfaitement fonctionner en ne proposant que des liens (et un titre) après une recherche (il peut y associer des infos générales, les mots-clés courants du site, les catégories sémantiques, etc)

malock

Le 15/04/2014 à 11h 50

#53

CryoGen a écrit :

En quoi c’est limite ? Si tu mets en place le robot.txt, tu es protégé. Tu as dit : NON. Si Google ou autre index tes images tu peux te plaindre légitimement.

Par contre, vu que le monde s’oriente sur une politique d’accord explicite (ce qui est contraire à la mentalité de départ d’Internet et le partage , avant sa commercialisation en gros) il faudrait peut-être passer sur un mode inverse et utiliser le robot.txt pour dire OUI.

De mon point de vue, c’est “limite” car rien n’assure qu’un moteur de recherche va parcourir ce fameux robots.txt : de ce que j’ai pu comprendre, la lecture de ce fichier est faite par convention (rien n’y les oblige donc).

S’assurer que tous les moteurs de recherche considèrent ce fichier réglerait le problème. Je ne suis pas sûr que ça plaise à tout le monde (ça serait imposer une norme qui va sans doute à l’encontre de la philosophie du net).

Inverser le fonctionnement du robots.txt viendrait aussi régler le soucis : là, ça ne plaira surement plus aux moteurs de recherche…

Cet avis se base sur ma petite compréhension du fonctionnement de tout cela et sur le postulat de départ qui est qu’un robots.txt peut-être ignoré par un moteur : si j’ai faux sur ça, évidement, mon propos tombe à l’eau.

v1nce a écrit :

Ils n’ont qu’à faire un site privé. Personne ne viendra leur indexer/piquer leurs photos.

Si leur site est public la solution c’est robots.txt.

Après faut peut-être ajouter de nouvelles directives dans robots.txt pour intégrer un droit de citation. Pas plus de x mots, résolution maxi des vignettes…

Voir plus haut dans ce commentaire. Ce que je crois comprendre, c’est que robots.txt n’est pas la solution (c’est tout de même un bon début de solution oui).

malock

Le 15/04/2014 à 11h 52

#54

Bug a écrit :

Mais tu peux le bloquer avec le htaccess " />

Ah ! La donnée qui me manquait.

Après, un htaccess, c’est peut-être pas à la portée de tout le monde non ?

psn00ps

Le 15/04/2014 à 11h 55

#55

yvo2m a écrit :

Parfait !

Je peux comprendre leur argument du “ce n’est pas à moi de dire que je ne veux pas être référencé”, car Google prend le droit d’indexer sans demander l’avis (m’enfin c’est le principe du web aussi).

Voilà, tu as tout dit. Il y a un fichier robots qui interdit l’indexage.

Tu le mets en place, si un robot l’ignore, alors justice.

Autrement la taxe sur le lien hypertexte " />" />" />" />

psn00ps

Le 15/04/2014 à 11h 58

#56

CryoGen a écrit :

Oui, faire évoluer le robot.txt n’est pas une mauvaise idée.

C’en est une, les zayan-droua doivent apprendre à faire un site comme tout le monde.

TiTan91

Le 15/04/2014 à 12h 06

#57

malock a écrit :

De mon point de vue, c’est “limite” car rien n’assure qu’un moteur de recherche va parcourir ce fameux robots.txt : de ce que j’ai pu comprendre, la lecture de ce fichier est faite par convention (rien n’y les oblige donc).

S’assurer que tous les moteurs de recherche considèrent ce fichier réglerait le problème. Je ne suis pas sûr que ça plaise à tout le monde (ça serait imposer une norme qui va sans doute à l’encontre de la philosophie du net).

Inverser le fonctionnement du robots.txt viendrait aussi régler le soucis : là, ça ne plaira surement plus aux moteurs de recherche…

Cet avis se base sur ma petite compréhension du fonctionnement de tout cela et sur le postulat de départ qui est qu’un robots.txt peut-être ignoré par un moteur : si j’ai faux sur ça, évidement, mon propos tombe à l’eau.

Voir plus haut dans ce commentaire. Ce que je crois comprendre, c’est que robots.txt n’est pas la solution (c’est tout de même un bon début de solution oui).

c est limite pcq t es pas FORCE de le prendre en compte ?

et l interdiction par défaut, t’es forcé de la prendre en compte peut être ?

non le robot.txt est LA solution

dans un sens ou dans l autre ca change rien (si ce n est la philisophie du web) : presque tout le monde le prend en compte, et éventuellement l’ignorer pourrait avoir des conséquences légales si le législateur le voulait.

psn00ps

Le 15/04/2014 à 12h 07

#58

malock a écrit :

Cet avis se base sur ma petite compréhension du fonctionnement de tout cela et sur le postulat de départ qui est qu’un robots.txt peut-être ignoré par un moteur : si j’ai faux sur ça, évidement, mon propos tombe à l’eau.

C’est la même chose que quelqu’un qui rentre dans un champ marqué propriété privée ou interdit sauf ayants droit

Il peut passer outre et il est averti des conséquences. " />" />

malock

Le 15/04/2014 à 12h 10

#59

TiTan91 a écrit :

c est limite pcq t es pas FORCE de le prendre en compte ?

et l interdiction par défaut, t’es forcé de la prendre en compte peut être ?

non le robot.txt est LA solution

dans un sens ou dans l autre ca change rien (si ce n est la philisophie du web) : presque tout le monde le prend en compte, et éventuellement l’ignorer pourrait avoir des conséquences légales si le législateur le voulait.

Non mais oui… on est jamais forcé de suivre les règles ok ok…

C’est LA solution si comme tu le dis dans la fin de ton commentaire, il est donné la possibilité à ceux qui ont mis en place un robots.txt et qui l’ont vu ignoré par les moteurs de recherche d’aller gueuler. Pour l’instant, c’est du vent : “Hé mais j’ai un robots.txt, pourquoi tu indexes ?” “Rien ne m’oblige à le lire, osef…”…

Khalev

Le 15/04/2014 à 12h 31

#60

v1nce a écrit :

GG pousse un peu quand même.

Faire des vignettes des images comme on fait des extraits des news c’est OK pour moi.

Mais afficher l’image dans sa résolution maxi sans avoir à aller sur le site référencé c’est pas glop. Ce serait comme citer l’article in extenso dans GG news.

Suffit d’utiliser le referer.

Je viens de tester chez moi quand je charge la page de résultats de GG où je clique sur l’image j’ai une GET qui part dans ce style:

GET /files/2008/06/141-10-0-0.1213711691.gif HTTP/1.1

Host: vidberg.blog.lemonde.fr

(…)

Referer:http://www.google.fr/imgres?imgurl=http%3A%2F%2Fvidberg.blog.lemonde.fr%2Ffiles%…

Connection: keep-alive

Ce à quoi le serveur répond par un :

HTTP/1.0 200 OK

C’est donc que le serveur accepte de réponde aux demandes d’images ayant pour but d’être afficher dans google.

Faith

Le 15/04/2014 à 12h 31

#61

TiTan91 a écrit :

non le robot.txt est LA solution

Pas en l’état actuel, il manque de subtilité.

On peut accepter l’indexation, mais pas la reprise totale de texte. On peut accepter l’indexation, mais pas la reprise des images. et de nombreuses autres combinaisons de ce genre.

Si le robot.txt permet ce niveau de tuning, alors là, ce sera LA solution.

Khalev

Le 15/04/2014 à 12h 33

#62

malock a écrit :

Non mais oui… on est jamais forcé de suivre les règles ok ok…

C’est LA solution si comme tu le dis dans la fin de ton commentaire, il est donné la possibilité à ceux qui ont mis en place un robots.txt et qui l’ont vu ignoré par les moteurs de recherche d’aller gueuler. Pour l’instant, c’est du vent : “Hé mais j’ai un robots.txt, pourquoi tu indexes ?” “Rien ne m’oblige à le lire, osef…”…

Il y a des moyens techniques de limiter les réponses à l’indexation. C’est un peu plus compliqué à mettre en place mais en même temps quand tu mets un serveur en ligne sur le net et que tu lui dis de répondre à toutes les requètes sans exceptions, faut pas se fâcher contre les autres si ton serveur fait ce que tu lui as dit de faire…

cid_Dileezer_geek

Le 15/04/2014 à 12h 37

#63

v1nce a écrit :

GG pousse un peu quand même.

Faire des vignettes des images comme on fait des extraits des news c’est OK pour moi.

Mais afficher l’image dans sa résolution maxi sans avoir à aller sur le site référencé c’est pas glop. Ce serait comme citer l’article in extenso dans GG news.

Ce que tu dis est faux, dès qu’on clique sur la vignette on se retrouve sur le site qui a édité l’image, donc faut arrêter de dire des conneries aussi. " />

Khalev

Le 15/04/2014 à 12h 41

#64

cid_Dileezer_geek a écrit :

Ce que tu dis est faux, dès qu’on clique sur la vignette on se retrouve sur le site qui a édité l’image, donc faut arrêter de dire des conneries aussi. " />

Il me semble qu’il y a 2 fonctionnements à GG images. Je l’utilise pas tant que ça donc je connais pas trop mais il y en a un où tu vois le site derrière et un autre où tu vois l’image sur fond noir avec les autres résultats de recherches au dessus et en dessous.

Ça serait intéressant de regarder la tête des get dans ce second format. Chez moi il n’est pas activé et j’ai aucune idée de comment l’activer.

malock

Le 15/04/2014 à 12h 41

#65

Khalev a écrit :

Il y a des moyens techniques de limiter les réponses à l’indexation. C’est un peu plus compliqué à mettre en place mais en même temps quand tu mets un serveur en ligne sur le net et que tu lui dis de répondre à toutes les requètes sans exceptions, faut pas se fâcher contre les autres si ton serveur fait ce que tu lui as dit de faire…

Oui, j’imagine bien qu’il y a des solutions. “Il y en a toujours”.

Moi, je ne suis pas fâché hein…

Je suis juste en désaccord quand je lie que le fichier robots.txt est la solution dans l’état.

S’il tend à l’être, il lui manque sans doute des niveaux de paramétrage comme l’indique Faith. Et surtout, il y a aujourd’hui aucun moyen de se retourner vers un moteur qui n’a pas respecté le fichier robots.txt.

Du coup, pour moi, il reste encore une solution largement incomplète.

Après, j’ai peut-être faux sur toute la ligne…

2show7

Le 15/04/2014 à 12h 47

#66

S’ils veulent un étrangleur, ils peuvent le trouver chez le marchand de moto du coin " />

cid_Dileezer_geek

Le 15/04/2014 à 12h 52

#67

Khalev a écrit :

Il me semble qu’il y a 2 fonctionnements à GG images. Je l’utilise pas tant que ça donc je connais pas trop mais il y en a un où tu vois le site derrière et un autre où tu vois l’image sur fond noir avec les autres résultats de recherches au dessus et en dessous.

Ça serait intéressant de regarder la tête des get dans ce second format. Chez moi il n’est pas activé et j’ai aucune idée de comment l’activer.

Je crois que ça dépend peut-être de noscript, avant sur Google images, j’avais effectivement un fond noir qui reprenait les différentes sources de l’image mais toujours en petit format et puis tu cliquais sur l’image qui te renvoie sur le site, depuis que j’ai interdit tout ce qui a un lien avec Google dans Noscript, je me retrouve avec le site qui a édité l’image directement en cliquant sur la vignette.

voici le lien de la capture d’écran que je viens de faire

momal

Le 15/04/2014 à 12h 53

#68

Ben c’est facile, le syndicat donne la liste de ses adherents, du coup Google evite d’aller sur leurs sites et pis c’est tout.

Khalev

Le 15/04/2014 à 12h 55

#69

malock a écrit :

Oui, j’imagine bien qu’il y a des solutions. “Il y en a toujours”.

Moi, je ne suis pas fâché hein…

Je suis juste en désaccord quand je lie que le fichier robots.txt est la solution dans l’état.

S’il tend à l’être, il lui manque sans doute des niveaux de paramétrage comme l’indique Faith. Et surtout, il y a aujourd’hui aucun moyen de se retourner vers un moteur qui n’a pas respecté le fichier robots.txt.

Du coup, pour moi, il reste encore une solution largement incomplète.

Après, j’ai peut-être faux sur toute la ligne…

Disons que contre Google, Bing, Qwant & co c’est efficace parce qu’ils jouent le jeu au moins niveau résultats (testé et approuvé en comparant ma DB qui respecte pas le robots.txt et les résultats de google/Bing/Qwant).

Après on pourrait très bien imaginer une obligation légale pour les moteur de recherche de respecter ce robot.txt. Ça solidifierai le truc et ça donnerait une base pour les sites pour se plaindre si un gros moteur ne respecte pas, tout en permettant aux moteurs de se protéger niveau responsabilité.

Mais clairement se plaindre de Google alors que celui-ci respecte déjà la norme établie alors qu’on ne l’utilise pas c’est très très con…

Ça va faire presque 20 ans que robots.txt existe, quand j’avais 16 piges je savais déjà en écrire un, c’est vraiment pas compliquer en plus. Tu crées un répertoire /images où tu fous toutes tes images tu écris dans ton fichier :

User-agent: *

Disallow: /images

Et tu copies le fichier à la racine de ton site et… voilà! Ça prend 10 secondes et maintenant on peut discuter calmement si tu peux trouver des cas où Google ne respecte pas ça. S’ils respectent ça pourquoi batailler? Pour toucher du Fric? Tu vas te faire jeter par toute la communauté du net parce que tu refuses d’utiliser un truc qui mine de rien fonctionne plutôt bien depuis 15 ans…

athlon64

Le 15/04/2014 à 12h 58

#70

momal a écrit :

Ben c’est facile, le syndicat donne la liste de ses adherents, du coup Google evite d’aller sur leurs sites et pis c’est tout.

Et après ils reviendront en disant qu’ils n’ont plus beaucoup de visibilité… (Oui je sais Google != d’Internet " />)

Khalev

Le 15/04/2014 à 12h 59

#71

cid_Dileezer_geek a écrit :

Je crois que ça dépend peut-être de noscript, avant sur Google images, j’avais effectivement un fond noir qui reprenait les différentes sources de l’image mais toujours en petit format et puis tu cliquais sur l’image qui te renvoie sur le site, depuis que j’ai interdit tout ce qui a un lien avec Google dans Noscript, je me retrouve avec le site qui a édité l’image directement en cliquant sur la vignette.

voici le lien de la capture d’écran que je viens de faire

J’ai un navigateur presque que sans extensions ici (j’ai juste Live-HTTP-headers et vimperator) et il m’affiche l’image en grand avec le site derrière en fond grisé (c’est le vrai site, j’ai regarde sur LHH justement) et en cliquant sur le fond grisé je tombe sur le site et sinon je tombe sur l’image toute seule.

momal

Le 15/04/2014 à 13h 11

#72

athlon64 a écrit :

Et après ils reviendront en disant qu’ils n’ont plus beaucoup de visibilité… (Oui je sais Google != d’Internet " />)

Ben oui, et la Google leur propose un contrat, avec des clauses qui disent qu’ils renoncent a demander des sous en echange d’une visibilite offerte par google…

Et que si ils parlent des termes du contrat, hop, c’est annule et ils sont dereferences dans la 1/2h qui suit…

cid_Dileezer_geek

Le 15/04/2014 à 13h 13

#73

athlon64 a écrit :

Et après ils reviendront en disant qu’ils n’ont plus beaucoup de visibilité… (Oui je sais Google != d’Internet " />)

Tout à fait, comme les journaux Belges il y a quelques temps, ils ont gueulés, Google les a désindexés, paf, ils regueulent parce qu’ils sont plus indexés, bref des vrais schizos…" />

Ce qu’il y a, c’est qu’ils veulent être indexés mais que Google leur file du fric pour ça et en plus tout ça pour une image, comme si des milliers de gens passaient leur temps à copier leur image 50 millions de fois, n’importe quoi, ils veulent juste faire comme les sociétés d’ayant droits de la musique et du cinéma, ramasser de la thune sans aucunes raisons.

Qu’un auteur soit payé pour un usage commercial de son image, ça c’est normal, mais je ne vois pas ce que les moteurs de recherche ont à voir dans ce contrat entre l’auteur et celui qui veut utiliser l’image à des fins commerciales, et si on supprime les moteurs de recherche, on fait comment pour trouver une image…, tout ça c’est juste de l’hypocrisie, point.

C’est comme l’autre qui vient gueuler mais qui oublie de mentionner que c’est parce qu’il a un site sur lequel il met son travail(images) et comme il a quasi pas de visites, il reporte la faute sur les moteurs de recherche et surtout Google car c’est celui qui a le plus de succès et surtout le plus de fric.

malock

Le 15/04/2014 à 13h 16

#74

Je dois mal m’exprimer " />

Je trouve tout à fait aberrant de lire “qu’il était hors de question pour les auteurs d’utiliser le fichier Robots.txt”.

Je me pose alors la question du pourquoi (tu me donnes d’ailleurs quelques pistes, merci) et je comprends que ce Robots.txt, c’est simplement “une communauté de gens biens” qui ont mis ça en place et qui, informellement, décident de le respecter. Et je trouve ça très bien.

Mais en me plaçant du point de vue des ayants-droit, je suppose qu’ils peuvent alors dire : “ce robots.txt, rien n’oblige un moteur à le respecter (et rien ne me permet de le poursuivre si je me rends compte qu’un moteur l’ignore), du coup, en quoi c’est la solution à mon problème ?”.

Je pense que beaucoup de monde joue le jeu oui. Mais pour que l’argument du robots.txt soit vraiment indémontable, je pense oui, qu’il faut…

Khalev a écrit :

(…) imaginer une obligation légale pour les moteur de recherche de respecter ce robot.txt. Ça solidifierai le truc et ça donnerait une base pour les sites pour se plaindre si un gros moteur ne respecte pas, tout en permettant aux moteurs de se protéger niveau responsabilité.

… par exemple. Et là, celui qui me dit “bin moi, je ne veux pas le mettre en place ce robots.txt”, qu’il ne vienne pas ce plaindre : c’est devenu LA solution “au même titre que l’affichage d’un panneau propriété privée”.

Khalev a écrit :

Mais clairement se plaindre de Google alors que celui-ci respecte déjà la norme établie alors qu’on ne l’utilise pas c’est très très con…

Tout à fait… Reste que la norme est “officieuse”. Manque plus à ce qu’elle devienne officielle.

Khalev a écrit :

Ça va faire presque 20 ans que robots.txt existe, quand j’avais 16 piges je savais déjà en écrire un, c’est vraiment pas compliquer en plus. Tu crées un répertoire /images où tu fous toutes tes images tu écris dans ton fichier :

Noté. J’en ai un qui traîne sur mon vieux (vieux vieux) site perso.

Khalev a écrit :

Et tu copies le fichier à la racine de ton site et… voilà! Ça prend 10 secondes et maintenant on peut discuter calmement si tu peux trouver des cas où Google ne respecte pas ça. S’ils respectent ça pourquoi batailler? Pour toucher du Fric? Tu vas te faire jeter par toute la communauté du net parce que tu refuses d’utiliser un truc qui mine de rien fonctionne plutôt bien depuis 15 ans…

[/quote]

Ah mais je n’ai jamais pensé que Google ne le suivait pas (ni Google ni un autre d’ailleurs). Je me demandais juste ce qui était bloquant côté ayant-droit. C’est tout. Et je ne vois que l’aspect “ce n’est pas officiel” (même si très éprouvé/approuvé par les communautés) qui l’est, bloquant.

Bug

Le 15/04/2014 à 13h 24

#75

malock a écrit :

Ah ! La donnée qui me manquait.

Après, un htaccess, c’est peut-être pas à la portée de tout le monde non ?

Pas si compliqué que ça, il existe des bons tutos " />

cid_Dileezer_geek

Le 15/04/2014 à 13h 32

#76

Khalev a écrit :

J’ai un navigateur presque que sans extensions ici (j’ai juste Live-HTTP-headers et vimperator) et il m’affiche l’image en grand avec le site derrière en fond grisé (c’est le vrai site, j’ai regarde sur LHH justement) et en cliquant sur le fond grisé je tombe sur le site et sinon je tombe sur l’image toute seule.

Je viens d’essayer sur IE et ça donne pareil que toi, mais il y a bien deux boutons, un qui permet d’aller consulter la page et l’autre qui affiche rien que l’image mais si on regarde l’adresse, c’est celle du site, je crois comprendre sur quoi ça gueule, sur le fait que l’image est affichée en taille réelle sur cette bande noire mais c’est parce que cette image est de relativement petite taille, si sur le site, l’image est de très grande taille (1680 X 1050) par exemple, celle-ci ne sera affichée en grande taille que sur le site original, donc…c’est un peu de la mauvaise foi leur gueulante, et puis comme l’ont dit d’autres, il y a le fichier ‘robots.txt’, même si c’est pas parfait pour certains, ça a le mérite d’exister.

Khalev

Le 15/04/2014 à 13h 40

#77

malock a écrit :

Je dois mal m’exprimer " />

Non c’est moi qui m’exprime mal. Je m’en prends surtout aux ayant-droits en te répondant alors que toi t’as rien demandé et du coup tout se mélange :P

Mon point de vue c’est que vu que ce genre de requète risque de se multiplier de plus en pus il faudrait mieux inscrire le respect du robots.txt dans la loi et l’associer à un statut de moteur de recherche.

Mais l’absence de ce droit n’empêche pas les AD de faire au moins l’effort de respecter ce fonctionnement.

Comme quoi on est d’accord c’est juste que j’ai voulu gueulé contre les AD en te répondant et c’est vrai qu’on a l’impression que c’est toi que j’engueule. Désolé " />

malock

Le 15/04/2014 à 13h 57

#78

Khalev a écrit :

(…)

Mon point de vue c’est que vu que ce genre de requète risque de se multiplier de plus en pus il faudrait mieux inscrire le respect du robots.txt dans la loi et l’associer à un statut de moteur de recherche.

Oui, voilà. C’est aussi mon point de vue (mais je suis sans doute moins “expert” que toi sur la question… j’y connais pas grand chose en “web”).

D’un côté, on déclare à ceux qui souhaitent créer du moteur de recherche qu’ils doivent respecter le robots.txt sinon pan-pan cu-cu…

De l’autre, on indique que si le référencement d’un site (d’une partie du site, du contenu) n’est pas souhaitée, alors il faut mettre en place un robots.txt…

Et voilà !

Khalev a écrit :

Mais l’absence de ce droit n’empêche pas les AD de faire au moins l’effort de respecter ce fonctionnement.

Ah ça absolument !

On reste habitué… ce genre d’ayants-droit vont certainement pas faire l’effort de suivre la communauté.

Khalev a écrit :

Comme quoi on est d’accord c’est juste que j’ai voulu gueulé contre les AD en te répondant et c’est vrai qu’on a l’impression que c’est toi que j’engueule. Désolé " />

On est effectivement d’accord. Il y a aucun mal.

" />

v1nce

Le 15/04/2014 à 14h 39

#79

cid_Dileezer_geek a écrit :

Ce que tu dis est faux, dès qu’on clique sur la vignette on se retrouve sur le site qui a édité l’image, donc faut arrêter de dire des conneries aussi. " />

D’abord une mise au point : es-tu allé voir la copie d’écran que j’ai faite de GGI ? A-t-on la même ?

Parce que lorsque je clique sur la vignette dans GGI je n’aboutis pas sur le site référencé et celui-ci n’est pas visible je reste sur GGI et la vignette venant du cache de GG est remplacée par une l’image qui s’affiche en pleine résolution (piquée sur le site d’origine ).

Maintenant que j’ai l’image affichée devant moi dans GGI, est-ce que j’ai encore besoin d’aller sur le site ? C’est très discutable.

Khalev

Le 15/04/2014 à 15h 53

#80

v1nce a écrit :

D’abord une mise au point : es-tu allé voir la copie d’écran que j’ai faite de GGI ? A-t-on la même ?

Parce que lorsque je clique sur la vignette dans GGI je n’aboutis pas sur le site référencé et celui-ci n’est pas visible je reste sur GGI et la vignette venant du cache de GG est remplacée par une l’image qui s’affiche en pleine résolution (piquée sur le site d’origine ).

Maintenant que j’ai l’image affichée devant moi dans GGI, est-ce que j’ai encore besoin d’aller sur le site ? C’est très discutable.

Tu demandes à Google une image il te retourne une image.

C’est le site qui accepte de t’envoyer une image sans envoyer tout le reste autour, c’est pareil que si tu tapais l’adresse de l’image directement.

D’ailleurs l’image qu’il t’est affichée provient du site web ou de Google?

Par contre on peut se demander pourquoi GG ne fais pas pareil pour les vidéos, avec les balises HTML5 c’est à peut près le même fonctionnement que pour les images. Un lien avec le fait qu’ils possèdent Youtube ou un héritage du passé?

v1nce

Le 15/04/2014 à 16h 39

#81

Khalev a écrit :

Tu demandes à Google une image il te retourne une image.

C’est le site qui accepte de t’envoyer une image sans envoyer tout le reste autour, c’est pareil que si tu tapais l’adresse de l’image directement.

D’ailleurs l’image qu’il t’est affichée provient du site web ou de Google?

Par contre on peut se demander pourquoi GG ne fais pas pareil pour les vidéos, avec les balises HTML5 c’est à peut près le même fonctionnement que pour les images. Un lien avec le fait qu’ils possèdent Youtube ou un héritage du passé?

GG affiche d’abord sa vignette puis l’image du site.

La on est plus dans le domaine du gagnant/gagnant (visibilité vs contenu). Le site référencé fourni du contenu sans rien en retour et en plus il doit payer la BP.

Oui il pourrait tester le referrer mais cela commence à devenir pénible et cela va être quoi la prochaine étape ? Google va forger des requêtes via xmlhttprequest pour envoyer un Fake referrer et récupérer malgré tout l’image sans l’héberger ?

127.0.0.1

Le 15/04/2014 à 18h 04

#82

Pour la SAIF, cela ne fait pas de doute : « Un lien hypertexte de renvoi vers une oeuvre localisée sur un autre site constitue un acte de communication au public. Il doit, selon nous, faire l’objet d’une autorisation d’exploitation »

Ce n’est pas Google qui fait un acte de communication au public. " />

C’est la personne qui a mis l’image sur un serveur web en accès libre.

Khalev

Le 16/04/2014 à 07h 51

#83

v1nce a écrit :

GG affiche d’abord sa vignette puis l’image du site.

La on est plus dans le domaine du gagnant/gagnant (visibilité vs contenu). Le site référencé fourni du contenu sans rien en retour et en plus il doit payer la BP.

Oui il pourrait tester le referrer mais cela commence à devenir pénible et cela va être quoi la prochaine étape ? Google va forger des requêtes via xmlhttprequest pour envoyer un Fake referrer et récupérer malgré tout l’image sans l’héberger ?

Ouai mais là on va taper dans la mauvaise fois de la part de Google. Alors que jusqu’à présent ils ont toujours eu le même comportement, et c’est le fonctionnement normal de tous les moteurs de recherches grand public “honnètes” depuis 20 ans…

Le site n’exclue pas ses images de la recherches via le robots.txt elles se retrouvent donc listés directement dans les résultats de recherches exactement comme les autres ressources présentes sur le serveur web, dont les pages web, les sons, les vidéos, etc.

C’est comme se plaindre que Google affiche un article de NXI sans afficher auparavant la page d’accueil de NXI. C’est débile, si tu autorises Google à indexer directement un article, il est normal que si tu demandes à Google cet article il te retourne l’article en question.

Je demande à Google de me trouver une ressource de type image correspondant à ce que je cherche, Google me retourne une ressource de type image que quelqu’un a mis en ligne sans en empécher l’indexation.

Je vois pas le problème en fait…

Faith

Le 16/04/2014 à 08h 49

#84

Khalev a écrit :

Je demande à Google de me trouver une ressource de type image correspondant à ce que je cherche, Google me retourne une ressource de type image que quelqu’un a mis en ligne sans en empécher l’indexation.

Je vois pas le problème en fait…

Le problème, c’est de résumer le net à Google.

Si tu as un blog et que Google affiche dans les résultats de ses recherches tout le contenu de ton blog, tu trouves ça normal ? Et bien ça ne l’est pas. Ce que tu écrit sur ton blog, tu en décides de la forme, de la présentation, du temps pendant lequel ce sera diffusé. Google n’a pas à choisir à ta place comment ce sera affiché, sélectionné, etc.

Google a le droit de fournir une citation, un thumbnail. mais là, il va trop loin: il devient un browser à l’intérieur du browser.

Khalev

Le 16/04/2014 à 09h 10

#85

Faith a écrit :

Le problème, c’est de résumer le net à Google.

Si tu as un blog et que Google affiche dans les résultats de ses recherches tout le contenu de ton blog, tu trouves ça normal ? Et bien ça ne l’est pas. Ce que tu écrit sur ton blog, tu en décides de la forme, de la présentation, du temps pendant lequel ce sera diffusé. Google n’a pas à choisir à ta place comment ce sera affiché, sélectionné, etc.

Google a le droit de fournir une citation, un thumbnail. mais là, il va trop loin: il devient un browser à l’intérieur du browser.

Ouai mais là c’est plus ce qui est reproché à Google par le SAIF ou par v1nce.

Après dans ce cas on parle d’une image seule, donc pas de mise en page, pas de position, pas de taille c’est juste la ressource image seule, ça ne change rien qu’elle soit affiché dans une frame Google ou directement dans le navigateur elle est identique dans les deux cas (juste la taille qui change mis si ça pose problème il suffit de charger la page complète vu qu’en la plupart des navigateurs utilisent un cache donc l’image n’est même pas rechargée depuis le serveur)

Faith

Le 16/04/2014 à 09h 24

#86

Khalev a écrit :

Ouai mais là c’est plus ce qui est reproché à Google par le SAIF ou par v1nce.

Si, un peu.

Après dans ce cas on parle d’une image seule, donc pas de mise en page, pas de position, pas de taille c’est juste la ressource image seule, ça ne change rien qu’elle soit affiché dans une frame Google ou directement dans le navigateur elle est identique dans les deux cas

Non: une image est souvent associée à un contexte.

Par ailleurs, un moteur de recherche a un droit de citation (donc partiel), la diffusion du document/image complet n’est pas acceptable.

Khalev

Le 16/04/2014 à 11h 14

#87

Faith a écrit :

Non: une image est souvent associée à un contexte.

Par ailleurs, un moteur de recherche a un droit de citation (donc partiel), la diffusion du document/image complet n’est pas acceptable.

Lorsque l’oeuvre a été divulguée, l’auteur ne peut interdire :

(…)

9° La reproduction ou la représentation, intégrale ou partielle, d’une oeuvre d’art graphique, plastique ou architecturale, par voie de presse écrite, audiovisuelle ou en ligne, dans un but exclusif d’information immédiate et en relation directe avec cette dernière, sous réserve d’indiquer clairement le nom de l’auteur.

http://www.legifrance.gouv.fr/affichCodeArticle.do?cidTexte=LEGITEXT000006069414…

A voir si on considère que le résultat d’une recherche constitue une “information immédiate”.

panda09

Le 16/04/2014 à 11h 53

#88

” Droit d’auteur : la SAIF insiste sur la taxation de Google Images “

Et si on leur collait des impôts sur ce qu’ils voleront/racketteront récolteront à hauteur de 200% de leurs gains, ils fermeraient leurs grandes gueules, non ?

Faith

Le 16/04/2014 à 11h 57

#89

Khalev a écrit :

A voir si on considère que le résultat d’une recherche constitue une “information immédiate”.

C’est déjà discutable, en effet.

Et tu as oublié la suite de ton article:

“Les reproductions ou représentations qui, notamment par leur nombre ou leur format, ne seraient pas en stricte proportion avec le but exclusif d’information immédiate poursuivi ou qui ne seraient pas en relation directe avec cette dernière donnent lieu à rémunération des auteurs sur la base des accords ou tarifs en vigueur dans les secteurs professionnels concernés. ”

La reproduction/reproduction de l’intégralité des images d’un site, en grandeur nature, peut difficilement être de la “stricte proportion”…

Khalev

Le 16/04/2014 à 12h 41

#90

Faith a écrit :

C’est déjà discutable, en effet.

Et tu as oublié la suite de ton article:

“Les reproductions ou représentations qui, notamment par leur nombre ou leur format, ne seraient pas en stricte proportion avec le but exclusif d’information immédiate poursuivi ou qui ne seraient pas en relation directe avec cette dernière donnent lieu à rémunération des auteurs sur la base des accords ou tarifs en vigueur dans les secteurs professionnels concernés. ”

La reproduction/reproduction de l’intégralité des images d’un site, en grandeur nature, peut difficilement être de la “stricte proportion”…

Sauf que Google ne “reproduit” (c’est discutable aussi puisqu’il met juste un lien vers le site original) que les images directement en lien avec la recherche à un instant T.

De plus les image ne sont pas forcément en grandeur nature puisqu’elles sont dans le cadre autorisé par GG " />

v1nce

Le 16/04/2014 à 13h 20

#91

Khalev a écrit :

Le site n’exclue pas ses images de la recherches via le robots.txt elles se retrouvent donc listés directement dans les résultats de recherches exactement comme les autres ressources présentes sur le serveur web, dont les pages web, les sons, les vidéos, etc.

Comment faire pour référencer des images ?

Je veux faire indexer mes photos.

Pour me démarquer de mes concurrents je les propose avec une super qualité (> 5000px * 5000px) sachant que c’est un des critères de restriction dispo sur GGI.

Je fais quoi ?

Je fais des thumb => on a pas l’info que les photos sont dispo avec des résolutions élevées

Je fais indexer des copies avec qualité dégradée (jpeg à 10%) => GGI affiche sur son site l’image de mon serveur en qualité dégradée => décourage les gens de venir voir

Je fais indexer les photos en super résolution => les gens peuvent piquer les photos depuis GGI(*) sans venir sur mon site

Bon après on peut jouer sur les referrer, useragent mettre des watermark sur les images mais ça devient lourd. d’autant plus s’il faut gérer tous les crawlers.

Khalev a écrit :

C’est comme se plaindre que Google affiche un article de NXI sans afficher auparavant la page d’accueil de NXI. C’est débile, si tu autorises Google à indexer directement un article, il est normal que si tu demandes à Google cet article il te retourne l’article en question.

Non. Il te donne à lire un extrait de cet article. En général OSEF de la page d’accueil ce qu’on veut c’est afficher de la pub pour payer le site. Donc proposer sur GG un extrait ou la page in extenso (avec sa pub) dans une iframe pour moi c’est équitable => GG provoque (l’envie d’) affichage de la page

Khalev a écrit :

Je demande à Google de me trouver une ressource de type image correspondant à ce que je cherche, Google me retourne une ressource de type image que quelqu’un a mis en ligne sans en empécher l’indexation.

Je vois pas le problème en fait…

Le problème avec GGI c’est qu’on n’a pas d”‘extrait d’image”.

* Je parle du GGI avec bandeau noir/slideshow. le fonctionnement de l’autre GGI est relativement équitable AMHA

Khalev

Le 16/04/2014 à 13h 31

#92

v1nce a écrit :

Je fais indexer les photos en super résolution => les gens peuvent piquer les photos depuis GGI(*) sans venir sur mon site

En même temps il me suffit de rentrer l’adresse exact de la photo pour la “piquer” aussi. GGI ne fait que lister les photos disponibles et te donne l’adresse pour la trouver.

Tu mets un truc en accès libre sur le net il faut pas s’étonner qu’il soit en accès libre ensuite…

v1nce a écrit :

Non. Il te donne à lire un extrait de cet article. En général OSEF de la page d’accueil ce qu’on veut c’est afficher de la pub pour payer le site. Donc proposer sur GG un extrait ou la page in extenso (avec sa pub) dans une iframe pour moi c’est équitable => GG provoque (l’envie d’) affichage de la page

Et dans le cas de GGI il te donne une miniature de l’image pour te donner envie de récupérer l’image complète depuis ton site.

v1nce a écrit :

Le problème avec GGI c’est qu’on n’a pas d”‘extrait d’image”.

Tu as les vignettes minusucles…

v1nce

Le 16/04/2014 à 15h 39

#93

Khalev a écrit :

Et dans le cas de GGI il te donne une miniature de l’image pour te donner envie de récupérer l’image complète depuis ton site.

Oui si tu passes par www.google.fr que tu fais ta recherche puis que tu cliques sur images pour relancer la recherche dans les images. Alors lorsque tu cliques sur une vignette tu as le site en grisé avec l’image en premier plan.

NON si tu passes parhttp://www.google.com/imghp?hl=FR.

Dans ca cas lorsque tu cliques sur une vignette tu restes DANS GGI qui t’affiche l’image DU SITE (en forçant sa taille) sans t’afficher le site du tout. Pour arriver au site il faut encore cliquer sur l’image (mais pourquoi s’embêter vu qu’on a déjà récupéré l’image)

Khalev

Le 17/04/2014 à 08h 25

#94

v1nce a écrit :

Oui si tu passes par www.google.fr que tu fais ta recherche puis que tu cliques sur images pour relancer la recherche dans les images. Alors lorsque tu cliques sur une vignette tu as le site en grisé avec l’image en premier plan.

NON si tu passes parhttp://www.google.com/imghp?hl=FR.

Dans ca cas lorsque tu cliques sur une vignette tu restes DANS GGI qui t’affiche l’image DU SITE (en forçant sa taille) sans t’afficher le site du tout. Pour arriver au site il faut encore cliquer sur l’image (mais pourquoi s’embêter vu qu’on a déjà récupéré l’image)

Quand je dis que tu récupère l’image depuis le site c’est l’image comme ça :http://static.pcinpact.com/images/bd/news/81968-pc-inpact-logo-3d.png

Si le site autorise que ce fichier soit indexé c’est normal que si ce fichier correspond à ce que tu recherches tu ne charges que ce fichier.

Qu’il soit intégré dans un cadre made in google ou qu’il t’affiche l’image directement ça ne change pas grand chose techniquement. Vu qu’en plus il n’y a pas de pub dans les résultats de Google on peut même pas dire qu’ils “volent” de l’argent.

Regarde en passant par un moteur commehttps://searx.laquadrature.net/. Le fonctionnement des images est identique, quand tu trouves l’image qui t’intéresse tu clique sur le lien et tu récupères l’image “pure” sans le contexte ou comme ça. Et c’est normal puisque c’est ce que tu demandes.

Techniquement il n’y a aucune différence entre le fonctionnement de Google et celui de seax. Juste que celui de Google est plus pratique si tu veux parcourir plus d’images…

Faith

Le 17/04/2014 à 08h 51

#95

Khalev a écrit :

Si le site autorise que ce fichier soit indexé c’est normal que si ce fichier correspond à ce que tu recherches tu ne charges que ce fichier.

Non, ce n’est pas “normal”.

C’est une dérive lamentable du web permettant à certains acteurs de piller les données de sites.

Quand on recherche une image à partir de mots-clés, un moteur de recherche utilise la page qui contient l’image pour en obtenir le sens.

Le moteur devrait rediriger vers cette page plutôt que de s’accaparer l’image.

A force de trouver des excuses aux acteurs majeurs du web, vous pourrissez la vie des petits sites qui demandent juste un équilibre entre moteur de recherche et fournisseur de contenu.

Khalev

Le 17/04/2014 à 10h 05

#96

Faith a écrit :

Non, ce n’est pas “normal”.

C’est une dérive lamentable du web permettant à certains acteurs de piller les données de sites.

Quand on recherche une image à partir de mots-clés, un moteur de recherche utilise la page qui contient l’image pour en obtenir le sens.

Le moteur devrait rediriger vers cette page plutôt que de s’accaparer l’image.

A force de trouver des excuses aux acteurs majeurs du web, vous pourrissez la vie des petits sites qui demandent juste un équilibre entre moteur de recherche et fournisseur de contenu.

Si tu veux pas que tes images soit directement accessibles depuis un moteur de recherche tu fous ton dossier image en disallow dans ton robots.txt et la seule façon de trouver tes images sera à partir de tes pages web dans lesquels tu auras intégré tes images.

Si tu fais pas ça ça veut dire que tu as voulu qu’elles soient indexables par un moteur de recherche.

Un ordi c’est con, si tu lui dis de mettre tes fichiers à disposition il va les mettre à disposition (sous certaines conditions que tu peux définir), si tu veux pas les mettre à disposition tu lui dis de pas les mettre à disposition. Vu que ça ne suffisait pas concernant les moteurs de recherche on a rajouter un fichier permettant de préciser son intention envers certains fichiers.

Si tu veux pas utiliser les outils à ta disposition grand bien t’en fasse mais faut pas se plaindre que tu te fasses “piller” ce que tu mets en ligne.

Je réexplique la situation : je demande à un moteur de recherche de me retourner des images, il me retourne des images, ces images proviennent de personnes qui les ont délibéremment mises en lignes, à partir de là le moteur de recherche n’a aucun moyen de savoir si l’auteur est d’accord ou pas pour qu’il les indexent directement, cependant ça semble logique que si la personne a mis ses images en lignes, il souhaite qu’elles soit accédées en ligne, donc accessible depuis un moteur de recherche (puisque c’est le moyen le plus simple d’accéder à des ressources en ligne). Pour permettre au gens de préciser cette dernière conclusion on a même créer un fichier qui permet de dire si une personne veut que ses fichiers soient indexés dans un moteur de recherche ou pas, si elle ne le veut pas elle a juste à le préciser dans ce fichier.

En quoi c’est parler de pillage? Si on part par là ça me fait chier aussi que Google permettre d’accéder directement à mes pages parce que j’ai foutu un iframe sur lequel il y a toutes les pubs et si les gens accèdent directement au page l’iframe ne se charge pas. C’est du pillage pur et simple et je trouve ça inacceptable.

Bah donc ce cas on me répondra de foutre mon dossier /pages/ en disallow dans le fichier robots.txt et mon problème sera résolu.

Regarde:

https://www.google.fr/search?q=logo+pcinpact

https://www.google.fr/search?q=logo+pcinpact&tbm=isch

Tu la vois là la différence? Je retrouve les mêmes résultat sauf d’un côté j’ai la page complète et de l’autre j’ai juste l’image (avec la possibilité de la retrouver dans le contexte).

Si je prends l’exemple de wikipedia et que dans leurs robots.txt ils bloquaient leurs images on ne verrait pas l’image dans la recherche image, mais on pourrait toujours voir le résultat dans la partie “web”.

Ce que vous voulez c’est que Google et chaque moteur de recherche contactent chaque webmaster pour savoir pour chaque image quelle était son intention c’est ça? Bin on vous donne le moyen de le faire automatiquement(même si ce moyen pourrait être étoffé), suffit de l’utiliser…

Faith

Le 17/04/2014 à 11h 38

#97

Khalev a écrit :

Si tu fais pas ça ça veut dire que tu as voulu qu’elles soient indexables par un moteur de recherche.

A toi maintenant de comprendre que “indexable” a un sens bien précis qui n’est pas celui de “extractible hors-contexte et hors-site”.

Pour info, voilà ce qu’est un index:http://www.mediadico.com/dictionnaire/definition/index/1

Un index N’EST PAS une gallerie.

Khalev

Le 17/04/2014 à 12h 19

#98

Faith a écrit :

A toi maintenant de comprendre que “indexable” a un sens bien précis qui n’est pas celui de “extractible hors-contexte et hors-site”.

Mais d’où il extrait quoi que ce soit?

La ressource est disponible telle-quelle toute seule il suffit de la demander et tu l’as. Il n’y a aucun effort à faire pour l’extraire elle existe toute seule. C’est pas parce qu’elle est intégré dans la page X qu’elle devient dépendant de la page X.

Prend le logo PC inpact, il est présent sur 36 000 pages pourtant c’est partout l’exact même fichier et je peux même te dire que c’est ce fichier (avec mon thème en tout cas):

https://www.pcinpact.com/images/clair/sprite-pci-2k12.png

Est-ce que le fait qu’il soit intégré dans d’autre page lui retire toute “valeur” pris séparément?

Si je demande à Google de me trouver le logo PCI et que je lui demande de l’afficher, est-ce qu’il doit m’ouvrir toutes les pages où le logo est utilisé où juste ce que je lui ai demandé, c’est à dire le logo, seul?

Faith a écrit :

Pour info, voilà ce qu’est un index:http://www.mediadico.com/dictionnaire/definition/index/1

Un index N’EST PAS une gallerie.

Si tu veux jouer sur les définitions :

http://www.oxforddictionaries.com/definition/english/index

Computing A set of items each of which specifies one of the records of a file and contains information about its address.

Faith

Le 17/04/2014 à 12h 30

#99

Khalev a écrit :

Si tu veux jouer sur les définitions :

http://www.oxforddictionaries.com/definition/english/index

Ce qui confirme bien ce que je disais.

Khalev

Le 17/04/2014 à 12h 43

#100

Faith a écrit :

Ce qui confirme bien ce que je disais.

Je vois pas comment.

A set of items : un ensemble d’objets : jusque là ça va

each of which specifies one of the records of a file : si on élargie un poil le concept de fichier au web tout entier on se retrouve avec un ensemble d’enregistrement qui spécifient un objet dans le web (dans le cas d’une image une miniature permet effectivement de spécifier un objet, surtout dans le cas où il faut que ça soit compréhensible par un être humain)

and contains information about its address : et ça c’est l’url de l’objet, donc de l’image.

Ils ne disent pas les endroits où les objets sont utilisés, ils disent l’adresse de l’objet “its adress”.

Faith

Le 17/04/2014 à 12h 55

#101

Khalev a écrit :

A set of items each of which specifies one of the records of a file and contains information about its address.

Dans un index, le “item” est obligatoirement différent du “record of a file”.

C’est la base du concept d’index.

Si tu ne respectes pas cette règle, ce n’est pas un index, c’est une galerie, une exposition, une étagère.

Ce qui, de toute façon, n’enlève rien au fait que Google empêche le partage de trafic entre ses services et les fournisseurs de contenus. Les fournisseurs de contenus deviennent justes bons à payer la bande passante pendant que Google récupère tout le bénéfice.

Khalev

Le 17/04/2014 à 13h 04

#102

Faith a écrit :

Dans un index, le “item” est obligatoirement différent du “record of a file”.

C’est la base du concept d’index.

Si tu ne respectes pas cette règle, ce n’est pas un index, c’est une galerie, une exposition, une étagère.

Ça tombe bien la “galerie” que tu vois sous Google ne contient aucune image originale, il contient que des miniatures et c’est quand tu cliques que tu vas voir l’image originale (c’est le principe des lien hypertexte là). Ce sont donc bien des “items” différent du record qu’ils désignent.

Faith a écrit :

Ce qui, de toute façon, n’enlève rien au fait que Google empêche le partage de trafic entre ses services et les fournisseurs de contenus. Les fournisseurs de contenus deviennent justes bons à payer la bande passante pendant que Google récupère tout le bénéfice.

Il n’y a pas pub sur les résultats d’images et techniquement quand tu cliques sur une image dans Google c’est exactement comme si tu chargeais uniquement l’image. C’est juste du javascript côté client et un get pour aller récupérer l’image sur le serveur d’origine, si on chargeait l’image originale directement la seule différence serait qu’il n’y aurait pas de javascript côté client, le get partirai de même et la réponse serait aussi grosse.

Faith

Le 17/04/2014 à 13h 11

#103

Allez, va

Khalev a écrit :

Ça tombe bien la “galerie” que tu vois sous Google ne contient aucune image originale, il contient que des miniatures et c’est quand tu cliques que tu vas voir l’image originale (c’est le principe des lien hypertexte là). Ce sont donc bien des “items” différent du record qu’ils désignent.

Mais bien sur…

Et dans une bibliothèque, tu as les livres écrits en police 4 qui servent d’index " />

c’est exactement comme si tu chargeais uniquement l’image.

Ce qui est impossible dans l’utilisation normale d’un site.

Quand on utilise normalement un site, on ne peut afficher une image qu’après avoir ouvert une page web de ce site.

Google brise le fonctionnement des sites, en exploite les ressources sans en partager les revenus.

Google n’est plus un indexeur depuis bien longtemps, Google est un centralisateur du Web. Le Web dont toute la philosophie repose sur le pair à pair se transforme inexorablement en minitel.

Et des gens qui devraient être éclairés en tant que fidèles de NXI/PCI arrivent à défendre ça ! c’est hallucinant !" />

Khalev

Le 17/04/2014 à 13h 31

#104

Faith a écrit :

Allez, va

Mais bien sur…

Et dans une bibliothèque, tu as les livres écrits en police 4 qui servent d’index " />

C’est pas ce que j’ai dit. J’ai bien précisé que la miniature était utile dans le cas d’une image pour décrire l’image.

Dans le cas d’un texte un extrait ou un résumé peut-être suffisant.

Faith a écrit :

Ce qui est impossible dans l’utilisation normale d’un site.

Quand on utilise normalement un site, on ne peut afficher une image qu’après avoir ouvert une page web de ce site.

Google brise le fonctionnement des sites, en exploite les ressources sans en partager les revenus.

Euh… pour moi le fonctionnement normal d’un site c’est ça:

http://www.w3.org/Protocols/rfc2616/rfc2616.html

Dit moi ce que Google casse là-dedans?

Faith a écrit :

Google n’est plus un indexeur depuis bien longtemps, Google est un centralisateur du Web. Le Web dont toute la philosophie repose sur le pair à pair se transforme inexorablement en minitel.

Et des gens qui devraient être éclairés en tant que fidèles de NXI/PCI arrivent à défendre ça ! c’est hallucinant !" />

Alors là je ne vois pas du tout de quoi tu parles… Quand je récupère l’image grand format je la récupère bien depuis le serveur d’origine.

Remplace Google parhttps://searx.laquadrature.net/ si tu veux, le fonctionnement est exactement le même… " />

Faith

Le 17/04/2014 à 13h 56

#105

Khalev a écrit :

Euh… pour moi le fonctionnement normal d’un site c’est ça:

http://www.w3.org/Protocols/rfc2616/rfc2616.html

Dit moi ce que Google casse là-dedans?

Il faut être d’une mauvaise foi hallucinante pour résumer le fonctionnement d’un site web au protocole http. Les ergonomistes se pissent dessus de rire en lisant ton post.

Sur ce, bye, tout a été dit.

Khalev

Le 17/04/2014 à 14h 05

#106

Faith a écrit :

Il faut être d’une mauvaise foi hallucinante pour résumer le fonctionnement d’un site web au protocole http. Les ergonomistes se pissent dessus de rire en lisant ton post.

Sur ce, bye, tout a été dit.

Bah je sais pas, source moi ce que c’est une utilisation normale d’un site alors.

Parce que perso je vois toujours pas où est le soucis à accéder à une ressource librement accessible depuis un index des ressources librement accessible.