Droit d'auteur : la SAIF insiste sur la taxation de Google Images

Droit d’auteur : la SAIF insiste sur la taxation de Google Images

Et SAIF quêta

Avatar de l'auteur
Marc Rees

Publié dans

Droit

15/04/2014 4 minutes
106

Droit d'auteur : la SAIF insiste sur la taxation de Google Images

Dans le cadre d’une consultation sur le droit d’auteur en Europe, La Société des auteurs des arts visuels et de l'image fixe (SAIF) a relancé la question des images utilisées par les moteurs de recherche.

saif google image

 

Dans sa consultation visant à déterminer s’il est utile de dépoussiérer le droit d’auteur, la Commission européenne expose la problématique juridique du lien internet. Il s’agit spécialement de savoir si un lien créé vers une œuvre doit ou non être soumis à autorisation préalable des ayants droit.

 

Pour la SAIF, cela ne fait pas de doute : « Un lien hypertexte de renvoi vers une oeuvre localisée sur un autre site constitue un acte de communication au public. Il doit, selon nous, faire l’objet d’une autorisation d’exploitation ». La société de gestion collective ajoute que cette autorisation est d’autant plus nécessaire « si le lien est constitué par un pointeur reproduisant l’œuvre elle-même (moteur de recherche d’images). »

Juste rémunération

Sur ce terrain, la société de perception et de répartition des droits insiste bien : « Dès lors qu’une œuvre, par exemple une image sert de pointeur, cette utilisation de l’œuvre doit être autorisée, car il s’agit d’une exploitation de l’œuvre elle-même et non plus d’un simple lien renvoyant l’internaute vers un site tiers qui pourrait la reproduire et communiquer au public sur l’une de ses pages l’image en question ». Elle cite alors l’exemple des moteurs de recherche d’images comme Google Images qui « ne se contente pas de renvoyer sur le site tiers, [mais] affiche l’image en totalité sur sa propre page de résultat en dehors de son contexte d’origine et permet de l’afficher en grand format ».

 

Dans ce cadre, poursuivent les ayants droit, « l’opérateur réalise une exploitation autonome des œuvres et en retire un avantage économique significatif », alors même que Google Images n'affiche aucune pub sur ces pages. Celle-ci conclut en conséquence que « de tels actes doivent faire l’objet d’une juste rémunération des ayants droit. »

Un écho à la proposition de loi de Philippe Marini

Ce débat posé devant la Commission européenne reprend les termes déjà exposés en France. Philippe Marini, sénateur et président de la Commission des Finances, a déposé la semaine dernière une proposition de loi visant à exiger des moteurs d’images une contribution au profit des sociétés de gestion collective. Le sénateur UMP veut ainsi soumettre ces utilisations à rémunération dès lors que les Google Images et autres référencent des contenus sous droit d’auteur « Selon ce dispositif, tout éditeur de moteur de recherche sera soumis à des obligations déclaratives et de reversements selon des barèmes fixés par convention ou par une commission paritaire » expose le parlementaire.

 

La mesure, qui avait déjà été imaginée au Conseil supérieur de la propriété littéraire et artistique, entre les murs du ministère de la Culture, évite difficilement les critiques liées à son aspect usine à gaz : selon Marini, les moteurs seraient en effet tenus de « fournir aux sociétés agréées le relevé des exploitations des œuvres et toutes informations nécessaires à la répartition des sommes perçues aux auteurs ou leurs ayants droit ». On imagine en effet sans mal l’ampleur du chantier s’il s’agissait pour Google de retracer l’usage des millions d’images référencées.

 

Rappelons enfin que la SAIF avait indiqué qu’il était hors de question pour les auteurs d’utiliser le fichier Robots.txt, lequel permet d’exclure du référencement les contenus hébergés sur un site. Google est « responsable du contenu qu’elle met à la disposition du public. Par conséquent [la société] ne peut pas se contenter de renverser la charge de la responsabilité en imposant aux sites d’origine d’indiquer s’ils souhaitent être référencés sur son moteur de recherche. » Bref, les créateurs doivent être référencés et les moteurs doivent payer.

Écrit par Marc Rees

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

Juste rémunération

Un écho à la proposition de loi de Philippe Marini

next n'a pas de brief le week-end

Le Brief ne travaille pas le week-end.
C'est dur, mais c'est comme ça.
Allez donc dans une forêt lointaine,
Éloignez-vous de ce clavier pour une fois !

Fermer

Commentaires (106)


Oui bien sûr, essayons d’utiliser internet sans moteur de recherche.

Sont malins eux.



In fine, ça revient à ça leur raisonnement…








Dez a écrit :



Oui bien sûr, essayons d’utiliser internet sans moteur de recherche.

Sont malins eux.



In fine, ça revient à ça leur raisonnement…







Facile tu tapes une URL au hasard. <img data-src=" />





Un lien hypertexte de renvoi vers une oeuvre localisée sur un autre site constitue un acte de communication au public. Il doit, selon nous, faire l’objet d’une autorisation d’exploitation







  • Pardon Mr l’Artiste, je peux mettre un lien vers votre site ?

  • Oui, c’est 1€

  • VTFF <img data-src=" />


robot.txt …



S’ils ne veulent pas que google référence leurs images.



A moins qu’ils veulent être référencé et payer en plus…




Droit d’auteur : la SAIF insiste sur la taxation de Google Images



:facepalm:








knos a écrit :



robot.txt …



S’ils ne veulent pas que google référence leurs images.



A moins qu’ils veulent être référencé et payer en plus…





Toi t’as pas lu la news jusqu’au bout <img data-src=" />









Bug a écrit :



Toi t’as pas lu la news jusqu’au bout <img data-src=" />







Non mais ça confirme ce que j’ai dis <img data-src=" /> . Ils veulent les deux. Profiter du service et ce faire payer pour.









knos a écrit :



Non mais ça confirme ce que j’ai dis <img data-src=" /> . Ils veulent les deux. Profiter du service et ce faire payer pour.





Ouai, exactement ce que demandaient les éditeurs de presse.



Passage en liste blanche pour tous les sites “d’artiste” qui réclament du pognon (il faut bien qu’ils se manifestent à un moment donné pour toucher leur rente, donc on peut générer une liste) : le robot.txt ne servira pas alors à indiquer une demande de non-référencement, mais à ce moment là une spécification d’acceptation de référencement. Ca devrait en calmer qq uns.


L’alternative serait que Google renverse le fonctionnement : !Robot.txt SI tu veux être référencé <img data-src=" />



Mais bon, c’est un coup à perdre 99% des images de google image <img data-src=" />


Un moteur de recherche d’images… Sans images…



Un moteur de recherche de quoi ?

Un moteur de quoi ?

Internet, c’est quoi ?





Je demande le retour de Lycos, des sites persos Infonie et de napster !!!


exclusif le résultât des futurs recherches d’images



ici



<img data-src=" />



[edit Atomusk : fixed]








Bug a écrit :



Ouai, exactement ce que demandaient les éditeurs de presse.







Et comme je le dis a chaque foi google devrait prendre le problème dans l’autre sens. (en tout cas sur Gnews et images).



A ceux qui veulent être référencé de s’inscrire. Et dommage pour les autres. Ainsi tu passerai par une CGU



J’ai pas compris le sous-titre, une âme charitable pour m’éclairer ?








Arnaud3013 a écrit :



J’ai pas compris le sous-titre, une âme charitable pour m’éclairer ?







etc? pas compris non plus



Intéressant ce concept…



Faire payer la mise à disposition d’un service.



Espérons que ça passe, on va pouvoir quémander aux réseaux sociaux pour référencer nos profils publics.








Arnaud3013 a écrit :



J’ai pas compris le sous-titre, une âme charitable pour m’éclairer ?





Salif Keita <img data-src=" />









knos a écrit :



robot.txt …



S’ils ne veulent pas que google référence leurs images.



A moins qu’ils veulent être référencé et payer en plus…





C’est le concept de base. Et en plus ca marche relativement bien. <img data-src=" />



Mr google, t’as l’autorisation de voir le répertoire public (et de m’envoyer des visteurs, merci)

Pour le répertoire private, comme son nom l’indique, mr google tu reste à la porte et on sera bon amis.

Mais bon encore des qui veulent, les épinard, le beurre, l’argent du beurre, le cul de la crémière et de la fermière, ainsi que les subventions de la PACS. <img data-src=" />



Comme d’habitude, quoi. <img data-src=" />



J’aimerais qu’un jour googl prenne au mot les revendications farfelus de nos politique et déréférence le contenu français de la toile. <img data-src=" />

<img data-src=" /> ou pas <img data-src=" />







ActionFighter a écrit :



Espérons que ça passe, on va pouvoir quémander aux réseaux sociaux pour référencer nos profils publics.





Oh oui, Oh oui <img data-src=" />




Dommage qu’il n’y ait pas une loi contre la stupidité, on pourrait les assigner en justice pour les forcer à réfléchir un peu.








Niktareum a écrit :



Je demande le retour de Lycos, des sites persos Infonie et de napster !!!







Et altavista <img data-src=" />









Niktareum a écrit :



Je demande le retour de Lycos, des sites persos Infonie et de napster !!!





Et des forfaits AOL ? <img data-src=" />









trash54 a écrit :



exclusif le résultât des futurs recherches d’images



ici



<img data-src=" />



[edit Atomusk : fixed]





Attention on risque de te coller un procès pour utilisation sans accord du créateur de l’œuvre “Page blanche sur fond blanc”.<img data-src=" />







ActionFighter a écrit :



Et des forfaits AOL ? <img data-src=" />





Surtout le son à la connexion…<img data-src=" />









Alucard63 a écrit :



Attention on risque de te coller un procès pour utilisation sans accord du créateur de l’œuvre “Page blanche sur fond blanc”.<img data-src=" />







Non c’est Whiteman qui va pouvoir porter plainte <img data-src=" />



official&channel=sb&tbm=isch&tbo=u&source=univ&sa=X&ei=afNMU4fiE4f_OZDDgcgH&ved=0CDIQsAQ&biw=1680&bih=912” target=”_blank” rel=“nofollow”>lien



Le problème c’est que google image ne se contente pas d’indexer:





google image ne se contente pas de renvoyer sur le site tiers, [mais] affiche l’image en totalité sur sa propre page de résultat en dehors de son contexte d’origine et permet de l’afficher en grand format





Si Google image se contentait d’afficher une vignette, et que pour voir l’image en grand tu dois aller sur le site, il n’y aurait pas lieu de se plaindre. Mais la, google abuse.








cyrilleberger a écrit :



Le problème c’est que google image ne se contente pas d’indexer:







Si Google image se contentait d’afficher une vignette, et que pour voir l’image en grand tu dois aller sur le site, il n’y aurait pas lieu de se plaindre. Mais la, google abuse.







Pourtant chez moi ca ce passe comme ca. Quand tu veux la voir en grand tu la vois extraite du site mais avec le site en font.









cyrilleberger a écrit :



Si Google image se contentait d’afficher une vignette, et que pour voir l’image en grand tu dois aller sur le site, il n’y aurait pas lieu de se plaindre. Mais la, google abuse.







C’est ce qu’il se passe non ?



C’est marrant tout de même. Je veux avoir de la visibilité : donc je fourni des visuels m’appartenant à une société de marketing qui va en faire des publicités contre des espèces sonnantes et trébuchantes…



Ici j’ai de la visibilité gratuite <img data-src=" /> vite ils me doivent du pognon <img data-src=" /> , trop dur d’ajouter un fichier gratuit pour empêcher ce pillage… par contre mon compte adsense est à renouveler ce mois ci….



Bravo <img data-src=" />








Alucard63 a écrit :



Surtout le son à la connexion…<img data-src=" />





Coupes moi ça ! Je suis au téléphone avec ta grand-mère !



Que tout les ayants droits lèvent le doigt…. OK, maintenant placez vous en file contre le mur… bien bien, présentez armes, FEU…problem solved. <img data-src=" />


De toute façon le fonctionnement actuel est le suivant:



-Vous avez des sous dans la caisse pour qu’on s’engraisse ?

-Non chef on en a plus

-Trouvez moi des sous

-Oui chef, on peux faire tourner la planche à billet ?

-Ben non sinon j’aurai plein de billets qui valent que dalle

-Que fait on chef ?

-Trouvez Volez le pognon là où il est

-Ok allons voir les grandes entreprises françaises

-Ha non non lobbying tous ça

-Ok chef bon ben Google, les frontaliers, la classe moyenne, Amazon, … on peux ?

-Oui oui on inventera une loi par la suite pour le justifier








Esarend a écrit :



Passage en liste blanche pour tous les sites “d’artiste” qui réclament du pognon (il faut bien qu’ils se manifestent à un moment donné pour toucher leur rente, donc on peut générer une liste) : le robot.txt ne servira pas alors à indiquer une demande de non-référencement, mais à ce moment là une spécification d’acceptation de référencement. Ça devrait en calmer qq uns.





Parfait !

Je peux comprendre leur argument du “ce n’est pas à moi de dire que je ne veux pas être référencé”, car Google prend le droit d’indexer sans demander l’avis (m’enfin c’est le principe du web aussi).

Mais créer la liste des ayant droits qui demandent de l’argent est nécessaire … et permet dans le même temps de les déférencer <img data-src=" />



Des questions peut-être un peu nazes… j’y connais que dalle…

C’ est normé les “Robots.txt” ? C’est seulement utilisé par/pour Google ou ça concerne également les autres moteurs de recherche ?

Ceux qui souhaitent créer un nouveau moteur de recherche sont-ils obligés de prendre en charge les Robots.txt ?









cyrilleberger a écrit :



Le problème c’est que google image ne se contente pas d’indexer:

Si Google image se contentait d’afficher une vignette, et que pour voir l’image en grand tu dois aller sur le site, il n’y aurait pas lieu de se plaindre. Mais la, google abuse.





Le grand format provient directement du site. Pas de Google. C’est pas la faute de Google si les sites laissent les images être référencées sans interdire le référencement du dossier images dans robot.txt.









malock a écrit :



Des question peut-être un peu nazes… j’y connais que dalle…

C’ est normé les “Robots.txt” ? C’est seulement utilisé par/pour Google ou ça concerne également les autres moteurs de recherche ?

Ceux qui souhaitent créer un nouveau moteur de recherche sont-ils obligés de prendre en charge les Robots.txt ?







Normalement c’est une norme commune. Après tu ne peu pas empêcher un robot qui ne respecte pas la règle que ne pas en tenir compte. Mais tout les moteurs de recherche respectable le suive.









malock a écrit :



Des question peut-être un peu nazes… j’y connais que dalle…

C’ est normé les “Robots.txt” ? C’est seulement utilisé par/pour Google ou ça concerne également les autres moteurs de recherche ?

Ceux qui souhaitent créer un nouveau moteur de recherche sont-ils obligés de prendre en charge les Robots.txt ?





C’est pour tous les “crawlers” qui veulent bien suivre ce qui est marqué dans le robots.txt.

Il n’y a aucune contrainte technique à appliquer les règles de robots.txt c’est purement une question de confiance.



Si tu crées un nouveau crawler tu peux tout à fait suivre les règles que tu veux, en général sur les miens je respecte les même règles que celui de Google puisque c’est celui qui est le plus présent. (mais pas tout le temps <img data-src=" />, en même temps c’est juste pour mon utilisation perso)









Jean_Peuplus a écrit :



C’est ce qu’il se passe non ?







Ca dépend. Actuellement sur GG images quand je clique sur une vignette moi je vois un bandeau noir avec l’image en grand format et des boutons pour naviguer vers des images de même thématique. Suffit de faire enregistrer sous (*) et tu as l’image du site référencé sans l’avoir ouvert.

Le bandeau propose 2 liens “Consulter la page” et “afficher l’image”.

Le second lien te permet d’ouvrir l’image directement sur le site (sans la page html)



* = faut attendre un peu parce qu’il commence par charger la vignette avant de charger l’image définitive



C’est pratique mais pour le site c’est pas top.

On peut accepter que GG fasse des vignettes mais quand même vouloir que les gens viennent sur le site. Et là à part bloquer les images si le referrer n’est pas son propre site je ne vois pas trop ce qu’on peut faire (et là c’est moins simple)










knos a écrit :



Normalement c’est une norme commune. Après tu ne peu pas empêcher un robot qui ne respecte pas la règle que ne pas en tenir compte. Mais tout les moteurs de recherche respectable le suive.











Khalev a écrit :



C’est pour tous les “crawlers” qui veulent bien suivre ce qui est marqué dans le robots.txt.

Il n’y a aucune contrainte technique à appliquer les règles de robots.txt c’est purement une question de confiance.



Si tu crées un nouveau crawler tu peux tout à fait suivre les règles que tu veux, en général sur les miens je respecte les même règles que celui de Google puisque c’est celui qui est le plus présent. (mais pas tout le temps <img data-src=" />, en même temps c’est juste pour mon utilisation perso)







Ok. Merci. J’ignorais même totalement le mot “crawlers”…

Du coup, ça m’a permis de visiter rapidement wikipédia et il y est indiqué que c’est par “convention” que les moteurs de recherche débutent par lire le fichier robots.txt.



Sans vouloir appuyer la requêtes des ayants droits, c’est tout de même “limite” de leur dire qu’il y a les robots.txt pour éviter tout ça alors qu’un moteur n’est pas dans l’obligation de le respecter…









Khalev a écrit :



Le grand format provient directement du site. Pas de Google. C’est pas la faute de Google si les sites laissent les images être référencées sans interdire le référencement du dossier images dans robot.txt.







GG pousse un peu quand même.

Faire des vignettes des images comme on fait des extraits des news c’est OK pour moi.

Mais afficher l’image dans sa résolution maxi sans avoir à aller sur le site référencé c’est pas glop. Ce serait comme citer l’article in extenso dans GG news.



<img data-src=" /> pour le sous titre ! <img data-src=" />





Ils veulent qui ? être payé a ne rien foutre ? <img data-src=" />








v1nce a écrit :



GG pousse un peu quand même.

Faire des vignettes des images comme on fait des extraits des news c’est OK pour moi.

Mais afficher l’image dans sa résolution maxi sans avoir à aller sur le site référencé c’est pas glop. Ce serait comme citer l’article in extenso dans GG news.







Sauf que chez moi si je veux voir l’image en grand c’est uniquement sur le site. Ou alors j’ai raté un truc.









malock a écrit :



Sans vouloir appuyer la requêtes des ayants droits, c’est tout de même “limite” de leur dire qu’il y a les robots.txt pour éviter tout ça alors qu’un moteur n’est pas dans l’obligation de le respecter…







Ils n’ont qu’à faire un site privé. Personne ne viendra leur indexer/piquer leurs photos.

Si leur site est public la solution c’est robots.txt.



Après faut peut-être ajouter de nouvelles directives dans robots.txt pour intégrer un droit de citation. Pas plus de x mots, résolution maxi des vignettes…









knos a écrit :



Sauf que chez moi si je veux voir l’image en grand c’est uniquement sur le site. Ou alors j’ai raté un truc.







Ca dépend des GG image.



At home (de mémoire) je vois le site en grisé avec un bandeau vertical à droite permettant de récupérer l’image.



At work pas besoin d’aller sur le site, tu récupères l’image direct depuis GG images via un panneau qui te présente la version taille réelle de la vignette cliquée + possibilité de naviguer vers des images proches









v1nce a écrit :



Ca dépend des GG image.



At home (de mémoire) je vois le site en grisé avec un bandeau vertical à droite permettant de récupérer l’image.



At work pas besoin d’aller sur le site, tu récupères l’image direct depuis GG images via un panneau qui te présente la version taille réelle de la vignette cliquée + possibilité de naviguer vers des images proches







Voilà ce que ça donne @work pour une recherche sur toto en cliquant sur la vignette 0 + 0 = 0

http://i62.tinypic.com/xfwxhj.jpg









malock a écrit :



Sans vouloir appuyer la requêtes des ayants droits, c’est tout de même “limite” de leur dire qu’il y a les robots.txt pour éviter tout ça alors qu’un moteur n’est pas dans l’obligation de le respecter…







En quoi c’est limite ? Si tu mets en place le robot.txt, tu es protégé. Tu as dit : NON. Si Google ou autre index tes images tu peux te plaindre légitimement.



Par contre, vu que le monde s’oriente sur une politique d’accord explicite (ce qui est contraire à la mentalité de départ d’Internet et le partage , avant sa commercialisation en gros) il faudrait peut-être passer sur un mode inverse et utiliser le robot.txt pour dire OUI.







v1nce a écrit :



Après faut peut-être ajouter de nouvelles directives dans robots.txt pour intégrer un droit de citation. Pas plus de x mots, résolution maxi des vignettes…







Oui, faire évoluer le robot.txt n’est pas une mauvaise idée.









ActionFighter a écrit :



Salif Keita <img data-src=" />





Merci;)









Khalev a écrit :



Le grand format provient directement du site. Pas de Google. C’est pas la faute de Google si les sites laissent les images être référencées sans interdire le référencement du dossier images dans robot.txt.







C’est quand même la faute de google: si quand tu clique sur l’image dans google image, ça t’affiche l’image en grand dans le site de google, et que tu puisse de la cliquer droit et sauvegarder l’image, sans jamais avoir été visiter le site.



Au début de google image, quand tu cliquais sur l’image dans google image, ça t’envoyais directement sur le site, où tu pouvais récupérer l’image en grand.



La, c’est un peu comme si le google “web”, quand tu clique sur un résultat, au lieu de t’emmener sur la page du site, il t’affichait le texte de la page, à l’intérieur du site google. Et par exemple, en cherchant “pcinpact taxation google”, au lieu de visiter cette page, on aurait le texte de l’article et rien d’autre.









trash54 a écrit :



exclusif le résultât des futurs recherches d’images



ici



<img data-src=" />



[edit Atomusk : fixed]









RT merci ;)









knos a écrit :



Normalement c’est une norme commune. Après tu ne peu pas empêcher un robot qui ne respecte pas la règle que ne pas en tenir compte. Mais tout les moteurs de recherche respectable le suive.





Mais tu peux le bloquer avec le htaccess <img data-src=" />





Rappelons enfin que la SAIF avait indiqué qu’il était hors de question pour les auteurs d’utiliser le fichier Robots.txt



Sont en lice pour le foutage de tronche d’or 2014….




Par conséquent [la société] ne peut pas se contenter de renverser la charge de la responsabilité en imposant aux sites d’origine d’indiquer s’ils souhaitent être référencés sur son moteur de recherche.





Sont sympa eux <img data-src=" />

Sur tous documents papier qu’ils publient il y a explicitement un mention de copyright ou autre, ce qui équivaut plus ou moins au robot.txt.

Donc pour les ouvrage matériel il font ce qu’il faut mais pas pour le numérique <img data-src=" />

Encore une bande de branquignole qui ne comprend pas la techno mais qui veux la tordre pour la faire respecter LEURS exigence sans autre considération. <img data-src=" />

Si au moins ils proposaient des solutions crédible, genre nouvelle norme, évolution de l’existant et pas seulement réclamer des €€€ sans rien foutre <img data-src=" /><img data-src=" /><img data-src=" /><img data-src=" />








knos a écrit :



Et comme je le dis a chaque foi google devrait prendre le problème dans l’autre sens. (en tout cas sur Gnews et images).



A ceux qui veulent être référencé de s’inscrire. Et dommage pour les autres. Ainsi tu passerai par une CGU









yvo2m a écrit :



Parfait !

Je peux comprendre leur argument du “ce n’est pas à moi de dire que je ne veux pas être référencé”, car Google prend le droit d’indexer sans demander l’avis (m’enfin c’est le principe du web aussi).

Mais créer la liste des ayant droits qui demandent de l’argent est nécessaire … et permet dans le même temps de les déférencer <img data-src=" />









CryoGen a écrit :



En quoi c’est limite ? Si tu mets en place le robot.txt, tu es protégé. Tu as dit : NON. Si Google ou autre index tes images tu peux te plaindre légitimement.



Par contre, vu que le monde s’oriente sur une politique d’accord explicite (ce qui est contraire à la mentalité de départ d’Internet et le partage , avant sa commercialisation en gros) il faudrait peut-être passer sur un mode inverse et utiliser le robot.txt pour dire OUI.







Oui, faire évoluer le robot.txt n’est pas une mauvaise idée.







sauf que changer le fonctionnement vers un accord explicite fera disparaitre des moteurs 99% du web

entre les sites qui ne sont plus maintenus à jour mais contiennent quand même du contenu intéressant, les personnes qui ont des pages perso mais sont incapables de configurer ça (et ceux la veulent etre sur google).



Au final passez à de l accord explicite serait très mauvais pour le web a mon avis, et ce serait un signal très négatif : à mon sens ça signifie que le web se ferme, que tout devient privé et que le public devient l’exception.

Après, c’est ce que souhaitent pas mal d’autorités, pour prendre le controle de cette “zone de non droit”.



Le web c’est ouvert, point !

vous voulez pas qu on se serve de vos sites, pas qu on les référence, pas qu’on y accède ? c’est à vous de les fermer !





enfin la j’ai plus l’impression qu’ils veulent pas d’une inversion de cette logique. Ils refusent juste la logique actuelle pour justifier de réclamer de l’argent. Ce seraient les premier embêtés si on passait par des accords, ils devraient disparaitre, ou accépter le référencement sans contrepartie.









TiTan91 a écrit :



sauf que changer le fonctionnement vers un accord explicite fera disparaitre des moteurs 99% du web





Il y a “accord explicite” et “accord explicite”.

Il ne peut pas y avoir d’accord explicite juste pour une indexation, ce serait effectivement mauvais pour le web (encore que, le web s’adapterait vite: de nos jour, qui héberge soi-même son site sans avoir 2 ou 3 connaissances en info ? les autres verrons leurs prestataires s’occuper du robots.txt (skyblog, etc y compris))



Mais pour la retranscription totale de photos et/ou d’articles, ce serait normal d’avoir besoin d’un accord explicite.



Un moteur de recherche peut parfaitement fonctionner en ne proposant que des liens (et un titre) après une recherche (il peut y associer des infos générales, les mots-clés courants du site, les catégories sémantiques, etc)









CryoGen a écrit :



En quoi c’est limite ? Si tu mets en place le robot.txt, tu es protégé. Tu as dit : NON. Si Google ou autre index tes images tu peux te plaindre légitimement.



Par contre, vu que le monde s’oriente sur une politique d’accord explicite (ce qui est contraire à la mentalité de départ d’Internet et le partage , avant sa commercialisation en gros) il faudrait peut-être passer sur un mode inverse et utiliser le robot.txt pour dire OUI.







De mon point de vue, c’est “limite” car rien n’assure qu’un moteur de recherche va parcourir ce fameux robots.txt : de ce que j’ai pu comprendre, la lecture de ce fichier est faite par convention (rien n’y les oblige donc).



S’assurer que tous les moteurs de recherche considèrent ce fichier réglerait le problème. Je ne suis pas sûr que ça plaise à tout le monde (ça serait imposer une norme qui va sans doute à l’encontre de la philosophie du net).

Inverser le fonctionnement du robots.txt viendrait aussi régler le soucis : là, ça ne plaira surement plus aux moteurs de recherche…



Cet avis se base sur ma petite compréhension du fonctionnement de tout cela et sur le postulat de départ qui est qu’un robots.txt peut-être ignoré par un moteur : si j’ai faux sur ça, évidement, mon propos tombe à l’eau.







v1nce a écrit :



Ils n’ont qu’à faire un site privé. Personne ne viendra leur indexer/piquer leurs photos.

Si leur site est public la solution c’est robots.txt.



Après faut peut-être ajouter de nouvelles directives dans robots.txt pour intégrer un droit de citation. Pas plus de x mots, résolution maxi des vignettes…







Voir plus haut dans ce commentaire. Ce que je crois comprendre, c’est que robots.txt n’est pas la solution (c’est tout de même un bon début de solution oui).









Bug a écrit :



Mais tu peux le bloquer avec le htaccess <img data-src=" />







Ah ! La donnée qui me manquait.

Après, un htaccess, c’est peut-être pas à la portée de tout le monde non ?









yvo2m a écrit :



Parfait !

Je peux comprendre leur argument du “ce n’est pas à moi de dire que je ne veux pas être référencé”, car Google prend le droit d’indexer sans demander l’avis (m’enfin c’est le principe du web aussi).





Voilà, tu as tout dit. Il y a un fichier robots qui interdit l’indexage.

Tu le mets en place, si un robot l’ignore, alors justice.

Autrement la taxe sur le lien hypertexte <img data-src=" /><img data-src=" /><img data-src=" /><img data-src=" />









CryoGen a écrit :



Oui, faire évoluer le robot.txt n’est pas une mauvaise idée.



C’en est une, les zayan-droua doivent apprendre à faire un site comme tout le monde.









malock a écrit :



De mon point de vue, c’est “limite” car rien n’assure qu’un moteur de recherche va parcourir ce fameux robots.txt : de ce que j’ai pu comprendre, la lecture de ce fichier est faite par convention (rien n’y les oblige donc).



S’assurer que tous les moteurs de recherche considèrent ce fichier réglerait le problème. Je ne suis pas sûr que ça plaise à tout le monde (ça serait imposer une norme qui va sans doute à l’encontre de la philosophie du net).

Inverser le fonctionnement du robots.txt viendrait aussi régler le soucis : là, ça ne plaira surement plus aux moteurs de recherche…



Cet avis se base sur ma petite compréhension du fonctionnement de tout cela et sur le postulat de départ qui est qu’un robots.txt peut-être ignoré par un moteur : si j’ai faux sur ça, évidement, mon propos tombe à l’eau.







Voir plus haut dans ce commentaire. Ce que je crois comprendre, c’est que robots.txt n’est pas la solution (c’est tout de même un bon début de solution oui).







c est limite pcq t es pas FORCE de le prendre en compte ?

et l interdiction par défaut, t’es forcé de la prendre en compte peut être ?



non le robot.txt est LA solution

dans un sens ou dans l autre ca change rien (si ce n est la philisophie du web) : presque tout le monde le prend en compte, et éventuellement l’ignorer pourrait avoir des conséquences légales si le législateur le voulait.









malock a écrit :



Cet avis se base sur ma petite compréhension du fonctionnement de tout cela et sur le postulat de départ qui est qu’un robots.txt peut-être ignoré par un moteur : si j’ai faux sur ça, évidement, mon propos tombe à l’eau.



C’est la même chose que quelqu’un qui rentre dans un champ marqué propriété privée ou interdit sauf ayants droit



Il peut passer outre et il est averti des conséquences. <img data-src=" /><img data-src=" />









TiTan91 a écrit :



c est limite pcq t es pas FORCE de le prendre en compte ?

et l interdiction par défaut, t’es forcé de la prendre en compte peut être ?



non le robot.txt est LA solution

dans un sens ou dans l autre ca change rien (si ce n est la philisophie du web) : presque tout le monde le prend en compte, et éventuellement l’ignorer pourrait avoir des conséquences légales si le législateur le voulait.







Non mais oui… on est jamais forcé de suivre les règles ok ok…

C’est LA solution si comme tu le dis dans la fin de ton commentaire, il est donné la possibilité à ceux qui ont mis en place un robots.txt et qui l’ont vu ignoré par les moteurs de recherche d’aller gueuler. Pour l’instant, c’est du vent : “Hé mais j’ai un robots.txt, pourquoi tu indexes ?” “Rien ne m’oblige à le lire, osef…”…









v1nce a écrit :



GG pousse un peu quand même.

Faire des vignettes des images comme on fait des extraits des news c’est OK pour moi.

Mais afficher l’image dans sa résolution maxi sans avoir à aller sur le site référencé c’est pas glop. Ce serait comme citer l’article in extenso dans GG news.





Suffit d’utiliser le referer.



Je viens de tester chez moi quand je charge la page de résultats de GG où je clique sur l’image j’ai une GET qui part dans ce style:



GET /files/2008/06/141-10-0-0.1213711691.gif HTTP/1.1

Host: vidberg.blog.lemonde.fr

(…)

Referer:http://www.google.fr/imgres?imgurl=http%3A%2F%2Fvidberg.blog.lemonde.fr%2Ffiles%…

Connection: keep-alive



Ce à quoi le serveur répond par un :



HTTP/1.0 200 OK





C’est donc que le serveur accepte de réponde aux demandes d’images ayant pour but d’être afficher dans google.









TiTan91 a écrit :



non le robot.txt est LA solution





Pas en l’état actuel, il manque de subtilité.

On peut accepter l’indexation, mais pas la reprise totale de texte. On peut accepter l’indexation, mais pas la reprise des images. et de nombreuses autres combinaisons de ce genre.



Si le robot.txt permet ce niveau de tuning, alors là, ce sera LA solution.









malock a écrit :



Non mais oui… on est jamais forcé de suivre les règles ok ok…

C’est LA solution si comme tu le dis dans la fin de ton commentaire, il est donné la possibilité à ceux qui ont mis en place un robots.txt et qui l’ont vu ignoré par les moteurs de recherche d’aller gueuler. Pour l’instant, c’est du vent : “Hé mais j’ai un robots.txt, pourquoi tu indexes ?” “Rien ne m’oblige à le lire, osef…”…





Il y a des moyens techniques de limiter les réponses à l’indexation. C’est un peu plus compliqué à mettre en place mais en même temps quand tu mets un serveur en ligne sur le net et que tu lui dis de répondre à toutes les requètes sans exceptions, faut pas se fâcher contre les autres si ton serveur fait ce que tu lui as dit de faire…









v1nce a écrit :



GG pousse un peu quand même.

Faire des vignettes des images comme on fait des extraits des news c’est OK pour moi.

Mais afficher l’image dans sa résolution maxi sans avoir à aller sur le site référencé c’est pas glop. Ce serait comme citer l’article in extenso dans GG news.



Ce que tu dis est faux, dès qu’on clique sur la vignette on se retrouve sur le site qui a édité l’image, donc faut arrêter de dire des conneries aussi. <img data-src=" />











cid_Dileezer_geek a écrit :



Ce que tu dis est faux, dès qu’on clique sur la vignette on se retrouve sur le site qui a édité l’image, donc faut arrêter de dire des conneries aussi. <img data-src=" />





Il me semble qu’il y a 2 fonctionnements à GG images. Je l’utilise pas tant que ça donc je connais pas trop mais il y en a un où tu vois le site derrière et un autre où tu vois l’image sur fond noir avec les autres résultats de recherches au dessus et en dessous.



Ça serait intéressant de regarder la tête des get dans ce second format. Chez moi il n’est pas activé et j’ai aucune idée de comment l’activer.









Khalev a écrit :



Il y a des moyens techniques de limiter les réponses à l’indexation. C’est un peu plus compliqué à mettre en place mais en même temps quand tu mets un serveur en ligne sur le net et que tu lui dis de répondre à toutes les requètes sans exceptions, faut pas se fâcher contre les autres si ton serveur fait ce que tu lui as dit de faire…







Oui, j’imagine bien qu’il y a des solutions. “Il y en a toujours”.



Moi, je ne suis pas fâché hein…

Je suis juste en désaccord quand je lie que le fichier robots.txt est la solution dans l’état.

S’il tend à l’être, il lui manque sans doute des niveaux de paramétrage comme l’indique Faith. Et surtout, il y a aujourd’hui aucun moyen de se retourner vers un moteur qui n’a pas respecté le fichier robots.txt.

Du coup, pour moi, il reste encore une solution largement incomplète.



Après, j’ai peut-être faux sur toute la ligne…



S’ils veulent un étrangleur, ils peuvent le trouver chez le marchand de moto du coin <img data-src=" />








Khalev a écrit :



Il me semble qu’il y a 2 fonctionnements à GG images. Je l’utilise pas tant que ça donc je connais pas trop mais il y en a un où tu vois le site derrière et un autre où tu vois l’image sur fond noir avec les autres résultats de recherches au dessus et en dessous.



Ça serait intéressant de regarder la tête des get dans ce second format. Chez moi il n’est pas activé et j’ai aucune idée de comment l’activer.



Je crois que ça dépend peut-être de noscript, avant sur Google images, j’avais effectivement un fond noir qui reprenait les différentes sources de l’image mais toujours en petit format et puis tu cliquais sur l’image qui te renvoie sur le site, depuis que j’ai interdit tout ce qui a un lien avec Google dans Noscript, je me retrouve avec le site qui a édité l’image directement en cliquant sur la vignette.

voici le lien de la capture d’écran que je viens de faire



Ben c’est facile, le syndicat donne la liste de ses adherents, du coup Google evite d’aller sur leurs sites et pis c’est tout.








malock a écrit :



Oui, j’imagine bien qu’il y a des solutions. “Il y en a toujours”.



Moi, je ne suis pas fâché hein…

Je suis juste en désaccord quand je lie que le fichier robots.txt est la solution dans l’état.

S’il tend à l’être, il lui manque sans doute des niveaux de paramétrage comme l’indique Faith. Et surtout, il y a aujourd’hui aucun moyen de se retourner vers un moteur qui n’a pas respecté le fichier robots.txt.

Du coup, pour moi, il reste encore une solution largement incomplète.



Après, j’ai peut-être faux sur toute la ligne…





Disons que contre Google, Bing, Qwant & co c’est efficace parce qu’ils jouent le jeu au moins niveau résultats (testé et approuvé en comparant ma DB qui respecte pas le robots.txt et les résultats de google/Bing/Qwant).



Après on pourrait très bien imaginer une obligation légale pour les moteur de recherche de respecter ce robot.txt. Ça solidifierai le truc et ça donnerait une base pour les sites pour se plaindre si un gros moteur ne respecte pas, tout en permettant aux moteurs de se protéger niveau responsabilité.

Mais clairement se plaindre de Google alors que celui-ci respecte déjà la norme établie alors qu’on ne l’utilise pas c’est très très con…



Ça va faire presque 20 ans que robots.txt existe, quand j’avais 16 piges je savais déjà en écrire un, c’est vraiment pas compliquer en plus. Tu crées un répertoire /images où tu fous toutes tes images tu écris dans ton fichier :



User-agent: *

Disallow: /images





Et tu copies le fichier à la racine de ton site et… voilà! Ça prend 10 secondes et maintenant on peut discuter calmement si tu peux trouver des cas où Google ne respecte pas ça. S’ils respectent ça pourquoi batailler? Pour toucher du Fric? Tu vas te faire jeter par toute la communauté du net parce que tu refuses d’utiliser un truc qui mine de rien fonctionne plutôt bien depuis 15 ans…









momal a écrit :



Ben c’est facile, le syndicat donne la liste de ses adherents, du coup Google evite d’aller sur leurs sites et pis c’est tout.





Et après ils reviendront en disant qu’ils n’ont plus beaucoup de visibilité… (Oui je sais Google != d’Internet <img data-src=" />)









cid_Dileezer_geek a écrit :



Je crois que ça dépend peut-être de noscript, avant sur Google images, j’avais effectivement un fond noir qui reprenait les différentes sources de l’image mais toujours en petit format et puis tu cliquais sur l’image qui te renvoie sur le site, depuis que j’ai interdit tout ce qui a un lien avec Google dans Noscript, je me retrouve avec le site qui a édité l’image directement en cliquant sur la vignette.

voici le lien de la capture d’écran que je viens de faire





J’ai un navigateur presque que sans extensions ici (j’ai juste Live-HTTP-headers et vimperator) et il m’affiche l’image en grand avec le site derrière en fond grisé (c’est le vrai site, j’ai regarde sur LHH justement) et en cliquant sur le fond grisé je tombe sur le site et sinon je tombe sur l’image toute seule.









athlon64 a écrit :



Et après ils reviendront en disant qu’ils n’ont plus beaucoup de visibilité… (Oui je sais Google != d’Internet <img data-src=" />)







Ben oui, et la Google leur propose un contrat, avec des clauses qui disent qu’ils renoncent a demander des sous en echange d’une visibilite offerte par google…

Et que si ils parlent des termes du contrat, hop, c’est annule et ils sont dereferences dans la 1/2h qui suit…









athlon64 a écrit :



Et après ils reviendront en disant qu’ils n’ont plus beaucoup de visibilité… (Oui je sais Google != d’Internet <img data-src=" />)



Tout à fait, comme les journaux Belges il y a quelques temps, ils ont gueulés, Google les a désindexés, paf, ils regueulent parce qu’ils sont plus indexés, bref des vrais schizos…<img data-src=" />

Ce qu’il y a, c’est qu’ils veulent être indexés mais que Google leur file du fric pour ça et en plus tout ça pour une image, comme si des milliers de gens passaient leur temps à copier leur image 50 millions de fois, n’importe quoi, ils veulent juste faire comme les sociétés d’ayant droits de la musique et du cinéma, ramasser de la thune sans aucunes raisons.

Qu’un auteur soit payé pour un usage commercial de son image, ça c’est normal, mais je ne vois pas ce que les moteurs de recherche ont à voir dans ce contrat entre l’auteur et celui qui veut utiliser l’image à des fins commerciales, et si on supprime les moteurs de recherche, on fait comment pour trouver une image…, tout ça c’est juste de l’hypocrisie, point.

C’est comme l’autre qui vient gueuler mais qui oublie de mentionner que c’est parce qu’il a un site sur lequel il met son travail(images) et comme il a quasi pas de visites, il reporte la faute sur les moteurs de recherche et surtout Google car c’est celui qui a le plus de succès et surtout le plus de fric.



Je dois mal m’exprimer <img data-src=" />



Je trouve tout à fait aberrant de lire “qu’il était hors de question pour les auteurs d’utiliser le fichier Robots.txt”.

Je me pose alors la question du pourquoi (tu me donnes d’ailleurs quelques pistes, merci) et je comprends que ce Robots.txt, c’est simplement “une communauté de gens biens” qui ont mis ça en place et qui, informellement, décident de le respecter. Et je trouve ça très bien.



Mais en me plaçant du point de vue des ayants-droit, je suppose qu’ils peuvent alors dire : “ce robots.txt, rien n’oblige un moteur à le respecter (et rien ne me permet de le poursuivre si je me rends compte qu’un moteur l’ignore), du coup, en quoi c’est la solution à mon problème ?”.



Je pense que beaucoup de monde joue le jeu oui. Mais pour que l’argument du robots.txt soit vraiment indémontable, je pense oui, qu’il faut…







Khalev a écrit :



(…) imaginer une obligation légale pour les moteur de recherche de respecter ce robot.txt. Ça solidifierai le truc et ça donnerait une base pour les sites pour se plaindre si un gros moteur ne respecte pas, tout en permettant aux moteurs de se protéger niveau responsabilité.







… par exemple. Et là, celui qui me dit “bin moi, je ne veux pas le mettre en place ce robots.txt”, qu’il ne vienne pas ce plaindre : c’est devenu LA solution “au même titre que l’affichage d’un panneau propriété privée”.







Khalev a écrit :



Mais clairement se plaindre de Google alors que celui-ci respecte déjà la norme établie alors qu’on ne l’utilise pas c’est très très con…





Tout à fait… Reste que la norme est “officieuse”. Manque plus à ce qu’elle devienne officielle.







Khalev a écrit :



Ça va faire presque 20 ans que robots.txt existe, quand j’avais 16 piges je savais déjà en écrire un, c’est vraiment pas compliquer en plus. Tu crées un répertoire /images où tu fous toutes tes images tu écris dans ton fichier :





Noté. J’en ai un qui traîne sur mon vieux (vieux vieux) site perso.







Khalev a écrit :



Et tu copies le fichier à la racine de ton site et… voilà! Ça prend 10 secondes et maintenant on peut discuter calmement si tu peux trouver des cas où Google ne respecte pas ça. S’ils respectent ça pourquoi batailler? Pour toucher du Fric? Tu vas te faire jeter par toute la communauté du net parce que tu refuses d’utiliser un truc qui mine de rien fonctionne plutôt bien depuis 15 ans…





[/quote]

Ah mais je n’ai jamais pensé que Google ne le suivait pas (ni Google ni un autre d’ailleurs). Je me demandais juste ce qui était bloquant côté ayant-droit. C’est tout. Et je ne vois que l’aspect “ce n’est pas officiel” (même si très éprouvé/approuvé par les communautés) qui l’est, bloquant.












malock a écrit :



Ah ! La donnée qui me manquait.

Après, un htaccess, c’est peut-être pas à la portée de tout le monde non ?





Pas si compliqué que ça, il existe des bons tutos <img data-src=" />









Khalev a écrit :



J’ai un navigateur presque que sans extensions ici (j’ai juste Live-HTTP-headers et vimperator) et il m’affiche l’image en grand avec le site derrière en fond grisé (c’est le vrai site, j’ai regarde sur LHH justement) et en cliquant sur le fond grisé je tombe sur le site et sinon je tombe sur l’image toute seule.



Je viens d’essayer sur IE et ça donne pareil que toi, mais il y a bien deux boutons, un qui permet d’aller consulter la page et l’autre qui affiche rien que l’image mais si on regarde l’adresse, c’est celle du site, je crois comprendre sur quoi ça gueule, sur le fait que l’image est affichée en taille réelle sur cette bande noire mais c’est parce que cette image est de relativement petite taille, si sur le site, l’image est de très grande taille (1680 X 1050) par exemple, celle-ci ne sera affichée en grande taille que sur le site original, donc…c’est un peu de la mauvaise foi leur gueulante, et puis comme l’ont dit d’autres, il y a le fichier ‘robots.txt’, même si c’est pas parfait pour certains, ça a le mérite d’exister.









malock a écrit :



Je dois mal m’exprimer <img data-src=" />





Non c’est moi qui m’exprime mal. Je m’en prends surtout aux ayant-droits en te répondant alors que toi t’as rien demandé et du coup tout se mélange :P



Mon point de vue c’est que vu que ce genre de requète risque de se multiplier de plus en pus il faudrait mieux inscrire le respect du robots.txt dans la loi et l’associer à un statut de moteur de recherche.

Mais l’absence de ce droit n’empêche pas les AD de faire au moins l’effort de respecter ce fonctionnement.



Comme quoi on est d’accord c’est juste que j’ai voulu gueulé contre les AD en te répondant et c’est vrai qu’on a l’impression que c’est toi que j’engueule. Désolé <img data-src=" />









Khalev a écrit :



(…)

Mon point de vue c’est que vu que ce genre de requète risque de se multiplier de plus en pus il faudrait mieux inscrire le respect du robots.txt dans la loi et l’associer à un statut de moteur de recherche.





Oui, voilà. C’est aussi mon point de vue (mais je suis sans doute moins “expert” que toi sur la question… j’y connais pas grand chose en “web”).

D’un côté, on déclare à ceux qui souhaitent créer du moteur de recherche qu’ils doivent respecter le robots.txt sinon pan-pan cu-cu…

De l’autre, on indique que si le référencement d’un site (d’une partie du site, du contenu) n’est pas souhaitée, alors il faut mettre en place un robots.txt…



Et voilà !







Khalev a écrit :



Mais l’absence de ce droit n’empêche pas les AD de faire au moins l’effort de respecter ce fonctionnement.





Ah ça absolument !

On reste habitué… ce genre d’ayants-droit vont certainement pas faire l’effort de suivre la communauté.







Khalev a écrit :



Comme quoi on est d’accord c’est juste que j’ai voulu gueulé contre les AD en te répondant et c’est vrai qu’on a l’impression que c’est toi que j’engueule. Désolé <img data-src=" />





On est effectivement d’accord. Il y a aucun mal.

<img data-src=" />










cid_Dileezer_geek a écrit :



Ce que tu dis est faux, dès qu’on clique sur la vignette on se retrouve sur le site qui a édité l’image, donc faut arrêter de dire des conneries aussi. <img data-src=" />







D’abord une mise au point : es-tu allé voir la copie d’écran que j’ai faite de GGI ? A-t-on la même ?

Parce que lorsque je clique sur la vignette dans GGI je n’aboutis pas sur le site référencé et celui-ci n’est pas visible je reste sur GGI et la vignette venant du cache de GG est remplacée par une l’image qui s’affiche en pleine résolution (piquée sur le site d’origine ).

Maintenant que j’ai l’image affichée devant moi dans GGI, est-ce que j’ai encore besoin d’aller sur le site ? C’est très discutable.









v1nce a écrit :



D’abord une mise au point : es-tu allé voir la copie d’écran que j’ai faite de GGI ? A-t-on la même ?

Parce que lorsque je clique sur la vignette dans GGI je n’aboutis pas sur le site référencé et celui-ci n’est pas visible je reste sur GGI et la vignette venant du cache de GG est remplacée par une l’image qui s’affiche en pleine résolution (piquée sur le site d’origine ).

Maintenant que j’ai l’image affichée devant moi dans GGI, est-ce que j’ai encore besoin d’aller sur le site ? C’est très discutable.





Tu demandes à Google une image il te retourne une image.

C’est le site qui accepte de t’envoyer une image sans envoyer tout le reste autour, c’est pareil que si tu tapais l’adresse de l’image directement.

D’ailleurs l’image qu’il t’est affichée provient du site web ou de Google?



Par contre on peut se demander pourquoi GG ne fais pas pareil pour les vidéos, avec les balises HTML5 c’est à peut près le même fonctionnement que pour les images. Un lien avec le fait qu’ils possèdent Youtube ou un héritage du passé?









Khalev a écrit :



Tu demandes à Google une image il te retourne une image.

C’est le site qui accepte de t’envoyer une image sans envoyer tout le reste autour, c’est pareil que si tu tapais l’adresse de l’image directement.

D’ailleurs l’image qu’il t’est affichée provient du site web ou de Google?



Par contre on peut se demander pourquoi GG ne fais pas pareil pour les vidéos, avec les balises HTML5 c’est à peut près le même fonctionnement que pour les images. Un lien avec le fait qu’ils possèdent Youtube ou un héritage du passé?







GG affiche d’abord sa vignette puis l’image du site.



La on est plus dans le domaine du gagnant/gagnant (visibilité vs contenu). Le site référencé fourni du contenu sans rien en retour et en plus il doit payer la BP.



Oui il pourrait tester le referrer mais cela commence à devenir pénible et cela va être quoi la prochaine étape ? Google va forger des requêtes via xmlhttprequest pour envoyer un Fake referrer et récupérer malgré tout l’image sans l’héberger ?





Pour la SAIF, cela ne fait pas de doute : « Un lien hypertexte de renvoi vers une oeuvre localisée sur un autre site constitue un acte de communication au public. Il doit, selon nous, faire l’objet d’une autorisation d’exploitation »





Ce n’est pas Google qui fait un acte de communication au public. <img data-src=" />



C’est la personne qui a mis l’image sur un serveur web en accès libre.








v1nce a écrit :



GG affiche d’abord sa vignette puis l’image du site.



La on est plus dans le domaine du gagnant/gagnant (visibilité vs contenu). Le site référencé fourni du contenu sans rien en retour et en plus il doit payer la BP.



Oui il pourrait tester le referrer mais cela commence à devenir pénible et cela va être quoi la prochaine étape ? Google va forger des requêtes via xmlhttprequest pour envoyer un Fake referrer et récupérer malgré tout l’image sans l’héberger ?





Ouai mais là on va taper dans la mauvaise fois de la part de Google. Alors que jusqu’à présent ils ont toujours eu le même comportement, et c’est le fonctionnement normal de tous les moteurs de recherches grand public “honnètes” depuis 20 ans…



Le site n’exclue pas ses images de la recherches via le robots.txt elles se retrouvent donc listés directement dans les résultats de recherches exactement comme les autres ressources présentes sur le serveur web, dont les pages web, les sons, les vidéos, etc.



C’est comme se plaindre que Google affiche un article de NXI sans afficher auparavant la page d’accueil de NXI. C’est débile, si tu autorises Google à indexer directement un article, il est normal que si tu demandes à Google cet article il te retourne l’article en question.



Je demande à Google de me trouver une ressource de type image correspondant à ce que je cherche, Google me retourne une ressource de type image que quelqu’un a mis en ligne sans en empécher l’indexation.

Je vois pas le problème en fait…









Khalev a écrit :



Je demande à Google de me trouver une ressource de type image correspondant à ce que je cherche, Google me retourne une ressource de type image que quelqu’un a mis en ligne sans en empécher l’indexation.

Je vois pas le problème en fait…





Le problème, c’est de résumer le net à Google.

Si tu as un blog et que Google affiche dans les résultats de ses recherches tout le contenu de ton blog, tu trouves ça normal ? Et bien ça ne l’est pas. Ce que tu écrit sur ton blog, tu en décides de la forme, de la présentation, du temps pendant lequel ce sera diffusé. Google n’a pas à choisir à ta place comment ce sera affiché, sélectionné, etc.



Google a le droit de fournir une citation, un thumbnail. mais là, il va trop loin: il devient un browser à l’intérieur du browser.









Faith a écrit :



Le problème, c’est de résumer le net à Google.

Si tu as un blog et que Google affiche dans les résultats de ses recherches tout le contenu de ton blog, tu trouves ça normal ? Et bien ça ne l’est pas. Ce que tu écrit sur ton blog, tu en décides de la forme, de la présentation, du temps pendant lequel ce sera diffusé. Google n’a pas à choisir à ta place comment ce sera affiché, sélectionné, etc.



Google a le droit de fournir une citation, un thumbnail. mais là, il va trop loin: il devient un browser à l’intérieur du browser.





Ouai mais là c’est plus ce qui est reproché à Google par le SAIF ou par v1nce.



Après dans ce cas on parle d’une image seule, donc pas de mise en page, pas de position, pas de taille c’est juste la ressource image seule, ça ne change rien qu’elle soit affiché dans une frame Google ou directement dans le navigateur elle est identique dans les deux cas (juste la taille qui change mis si ça pose problème il suffit de charger la page complète vu qu’en la plupart des navigateurs utilisent un cache donc l’image n’est même pas rechargée depuis le serveur)









Khalev a écrit :



Ouai mais là c’est plus ce qui est reproché à Google par le SAIF ou par v1nce.





Si, un peu.





Après dans ce cas on parle d’une image seule, donc pas de mise en page, pas de position, pas de taille c’est juste la ressource image seule, ça ne change rien qu’elle soit affiché dans une frame Google ou directement dans le navigateur elle est identique dans les deux cas



Non: une image est souvent associée à un contexte.

Par ailleurs, un moteur de recherche a un droit de citation (donc partiel), la diffusion du document/image complet n’est pas acceptable.









Faith a écrit :



Non: une image est souvent associée à un contexte.

Par ailleurs, un moteur de recherche a un droit de citation (donc partiel), la diffusion du document/image complet n’est pas acceptable.









Lorsque l’oeuvre a été divulguée, l’auteur ne peut interdire :

(…)

9° La reproduction ou la représentation, intégrale ou partielle, d’une oeuvre d’art graphique, plastique ou architecturale, par voie de presse écrite, audiovisuelle ou en ligne, dans un but exclusif d’information immédiate et en relation directe avec cette dernière, sous réserve d’indiquer clairement le nom de l’auteur.



http://www.legifrance.gouv.fr/affichCodeArticle.do?cidTexte=LEGITEXT000006069414…



A voir si on considère que le résultat d’une recherche constitue une “information immédiate”.



” Droit d’auteur : la SAIF insiste sur la taxation de Google Images “



Et si on leur collait des impôts sur ce qu’ils voleront/racketteront récolteront à hauteur de 200% de leurs gains, ils fermeraient leurs grandes gueules, non ?








Khalev a écrit :



A voir si on considère que le résultat d’une recherche constitue une “information immédiate”.





C’est déjà discutable, en effet.



Et tu as oublié la suite de ton article:

“Les reproductions ou représentations qui, notamment par leur nombre ou leur format, ne seraient pas en stricte proportion avec le but exclusif d’information immédiate poursuivi ou qui ne seraient pas en relation directe avec cette dernière donnent lieu à rémunération des auteurs sur la base des accords ou tarifs en vigueur dans les secteurs professionnels concernés. ”



La reproduction/reproduction de l’intégralité des images d’un site, en grandeur nature, peut difficilement être de la “stricte proportion”…









Faith a écrit :



C’est déjà discutable, en effet.



Et tu as oublié la suite de ton article:

“Les reproductions ou représentations qui, notamment par leur nombre ou leur format, ne seraient pas en stricte proportion avec le but exclusif d’information immédiate poursuivi ou qui ne seraient pas en relation directe avec cette dernière donnent lieu à rémunération des auteurs sur la base des accords ou tarifs en vigueur dans les secteurs professionnels concernés. ”



La reproduction/reproduction de l’intégralité des images d’un site, en grandeur nature, peut difficilement être de la “stricte proportion”…





Sauf que Google ne “reproduit” (c’est discutable aussi puisqu’il met juste un lien vers le site original) que les images directement en lien avec la recherche à un instant T.

De plus les image ne sont pas forcément en grandeur nature puisqu’elles sont dans le cadre autorisé par GG <img data-src=" />









Khalev a écrit :



Le site n’exclue pas ses images de la recherches via le robots.txt elles se retrouvent donc listés directement dans les résultats de recherches exactement comme les autres ressources présentes sur le serveur web, dont les pages web, les sons, les vidéos, etc.







Comment faire pour référencer des images ?

Je veux faire indexer mes photos.

Pour me démarquer de mes concurrents je les propose avec une super qualité (&gt; 5000px * 5000px) sachant que c’est un des critères de restriction dispo sur GGI.

Je fais quoi ?

Je fais des thumb =&gt; on a pas l’info que les photos sont dispo avec des résolutions élevées

Je fais indexer des copies avec qualité dégradée (jpeg à 10%) =&gt; GGI affiche sur son site l’image de mon serveur en qualité dégradée =&gt; décourage les gens de venir voir

Je fais indexer les photos en super résolution =&gt; les gens peuvent piquer les photos depuis GGI(*) sans venir sur mon site



Bon après on peut jouer sur les referrer, useragent mettre des watermark sur les images mais ça devient lourd. d’autant plus s’il faut gérer tous les crawlers.









Khalev a écrit :



C’est comme se plaindre que Google affiche un article de NXI sans afficher auparavant la page d’accueil de NXI. C’est débile, si tu autorises Google à indexer directement un article, il est normal que si tu demandes à Google cet article il te retourne l’article en question.









Non. Il te donne à lire un extrait de cet article. En général OSEF de la page d’accueil ce qu’on veut c’est afficher de la pub pour payer le site. Donc proposer sur GG un extrait ou la page in extenso (avec sa pub) dans une iframe pour moi c’est équitable =&gt; GG provoque (l’envie d’) affichage de la page









Khalev a écrit :



Je demande à Google de me trouver une ressource de type image correspondant à ce que je cherche, Google me retourne une ressource de type image que quelqu’un a mis en ligne sans en empécher l’indexation.

Je vois pas le problème en fait…







Le problème avec GGI c’est qu’on n’a pas d”‘extrait d’image”.





* Je parle du GGI avec bandeau noir/slideshow. le fonctionnement de l’autre GGI est relativement équitable AMHA









v1nce a écrit :



Je fais indexer les photos en super résolution =&gt; les gens peuvent piquer les photos depuis GGI(*) sans venir sur mon site





En même temps il me suffit de rentrer l’adresse exact de la photo pour la “piquer” aussi. GGI ne fait que lister les photos disponibles et te donne l’adresse pour la trouver.

Tu mets un truc en accès libre sur le net il faut pas s’étonner qu’il soit en accès libre ensuite…





v1nce a écrit :



Non. Il te donne à lire un extrait de cet article. En général OSEF de la page d’accueil ce qu’on veut c’est afficher de la pub pour payer le site. Donc proposer sur GG un extrait ou la page in extenso (avec sa pub) dans une iframe pour moi c’est équitable =&gt; GG provoque (l’envie d’) affichage de la page





Et dans le cas de GGI il te donne une miniature de l’image pour te donner envie de récupérer l’image complète depuis ton site.



v1nce a écrit :



Le problème avec GGI c’est qu’on n’a pas d”‘extrait d’image”.





Tu as les vignettes minusucles…









Khalev a écrit :



Et dans le cas de GGI il te donne une miniature de l’image pour te donner envie de récupérer l’image complète depuis ton site.









Oui si tu passes par www.google.fr que tu fais ta recherche puis que tu cliques sur images pour relancer la recherche dans les images. Alors lorsque tu cliques sur une vignette tu as le site en grisé avec l’image en premier plan.



NON si tu passes parhttp://www.google.com/imghp?hl=FR.

Dans ca cas lorsque tu cliques sur une vignette tu restes DANS GGI qui t’affiche l’image DU SITE (en forçant sa taille) sans t’afficher le site du tout. Pour arriver au site il faut encore cliquer sur l’image (mais pourquoi s’embêter vu qu’on a déjà récupéré l’image)










v1nce a écrit :



Oui si tu passes par www.google.fr que tu fais ta recherche puis que tu cliques sur images pour relancer la recherche dans les images. Alors lorsque tu cliques sur une vignette tu as le site en grisé avec l’image en premier plan.



NON si tu passes parhttp://www.google.com/imghp?hl=FR.

Dans ca cas lorsque tu cliques sur une vignette tu restes DANS GGI qui t’affiche l’image DU SITE (en forçant sa taille) sans t’afficher le site du tout. Pour arriver au site il faut encore cliquer sur l’image (mais pourquoi s’embêter vu qu’on a déjà récupéré l’image)





Quand je dis que tu récupère l’image depuis le site c’est l’image comme ça :http://static.pcinpact.com/images/bd/news/81968-pc-inpact-logo-3d.png



Si le site autorise que ce fichier soit indexé c’est normal que si ce fichier correspond à ce que tu recherches tu ne charges que ce fichier.



Qu’il soit intégré dans un cadre made in google ou qu’il t’affiche l’image directement ça ne change pas grand chose techniquement. Vu qu’en plus il n’y a pas de pub dans les résultats de Google on peut même pas dire qu’ils “volent” de l’argent.



Regarde en passant par un moteur commehttps://searx.laquadrature.net/. Le fonctionnement des images est identique, quand tu trouves l’image qui t’intéresse tu clique sur le lien et tu récupères l’image “pure” sans le contexte ou comme ça. Et c’est normal puisque c’est ce que tu demandes.



Techniquement il n’y a aucune différence entre le fonctionnement de Google et celui de seax. Juste que celui de Google est plus pratique si tu veux parcourir plus d’images…









Khalev a écrit :



Si le site autorise que ce fichier soit indexé c’est normal que si ce fichier correspond à ce que tu recherches tu ne charges que ce fichier.





Non, ce n’est pas “normal”.

C’est une dérive lamentable du web permettant à certains acteurs de piller les données de sites.



Quand on recherche une image à partir de mots-clés, un moteur de recherche utilise la page qui contient l’image pour en obtenir le sens.

Le moteur devrait rediriger vers cette page plutôt que de s’accaparer l’image.



A force de trouver des excuses aux acteurs majeurs du web, vous pourrissez la vie des petits sites qui demandent juste un équilibre entre moteur de recherche et fournisseur de contenu.









Faith a écrit :



Non, ce n’est pas “normal”.

C’est une dérive lamentable du web permettant à certains acteurs de piller les données de sites.



Quand on recherche une image à partir de mots-clés, un moteur de recherche utilise la page qui contient l’image pour en obtenir le sens.

Le moteur devrait rediriger vers cette page plutôt que de s’accaparer l’image.



A force de trouver des excuses aux acteurs majeurs du web, vous pourrissez la vie des petits sites qui demandent juste un équilibre entre moteur de recherche et fournisseur de contenu.





Si tu veux pas que tes images soit directement accessibles depuis un moteur de recherche tu fous ton dossier image en disallow dans ton robots.txt et la seule façon de trouver tes images sera à partir de tes pages web dans lesquels tu auras intégré tes images.



Si tu fais pas ça ça veut dire que tu as voulu qu’elles soient indexables par un moteur de recherche.



Un ordi c’est con, si tu lui dis de mettre tes fichiers à disposition il va les mettre à disposition (sous certaines conditions que tu peux définir), si tu veux pas les mettre à disposition tu lui dis de pas les mettre à disposition. Vu que ça ne suffisait pas concernant les moteurs de recherche on a rajouter un fichier permettant de préciser son intention envers certains fichiers.

Si tu veux pas utiliser les outils à ta disposition grand bien t’en fasse mais faut pas se plaindre que tu te fasses “piller” ce que tu mets en ligne.



Je réexplique la situation : je demande à un moteur de recherche de me retourner des images, il me retourne des images, ces images proviennent de personnes qui les ont délibéremment mises en lignes, à partir de là le moteur de recherche n’a aucun moyen de savoir si l’auteur est d’accord ou pas pour qu’il les indexent directement, cependant ça semble logique que si la personne a mis ses images en lignes, il souhaite qu’elles soit accédées en ligne, donc accessible depuis un moteur de recherche (puisque c’est le moyen le plus simple d’accéder à des ressources en ligne). Pour permettre au gens de préciser cette dernière conclusion on a même créer un fichier qui permet de dire si une personne veut que ses fichiers soient indexés dans un moteur de recherche ou pas, si elle ne le veut pas elle a juste à le préciser dans ce fichier.



En quoi c’est parler de pillage? Si on part par là ça me fait chier aussi que Google permettre d’accéder directement à mes pages parce que j’ai foutu un iframe sur lequel il y a toutes les pubs et si les gens accèdent directement au page l’iframe ne se charge pas. C’est du pillage pur et simple et je trouve ça inacceptable.



Bah donc ce cas on me répondra de foutre mon dossier /pages/ en disallow dans le fichier robots.txt et mon problème sera résolu.



Regarde:

https://www.google.fr/search?q=logo+pcinpact

https://www.google.fr/search?q=logo+pcinpact&tbm=isch



Tu la vois là la différence? Je retrouve les mêmes résultat sauf d’un côté j’ai la page complète et de l’autre j’ai juste l’image (avec la possibilité de la retrouver dans le contexte).

Si je prends l’exemple de wikipedia et que dans leurs robots.txt ils bloquaient leurs images on ne verrait pas l’image dans la recherche image, mais on pourrait toujours voir le résultat dans la partie “web”.



Ce que vous voulez c’est que Google et chaque moteur de recherche contactent chaque webmaster pour savoir pour chaque image quelle était son intention c’est ça? Bin on vous donne le moyen de le faire automatiquement(même si ce moyen pourrait être étoffé), suffit de l’utiliser…









Khalev a écrit :



Si tu fais pas ça ça veut dire que tu as voulu qu’elles soient indexables par un moteur de recherche.





A toi maintenant de comprendre que “indexable” a un sens bien précis qui n’est pas celui de “extractible hors-contexte et hors-site”.



Pour info, voilà ce qu’est un index:http://www.mediadico.com/dictionnaire/definition/index/1

Un index N’EST PAS une gallerie.









Faith a écrit :



A toi maintenant de comprendre que “indexable” a un sens bien précis qui n’est pas celui de “extractible hors-contexte et hors-site”.





Mais d’où il extrait quoi que ce soit?



La ressource est disponible telle-quelle toute seule il suffit de la demander et tu l’as. Il n’y a aucun effort à faire pour l’extraire elle existe toute seule. C’est pas parce qu’elle est intégré dans la page X qu’elle devient dépendant de la page X.



Prend le logo PC inpact, il est présent sur 36 000 pages pourtant c’est partout l’exact même fichier et je peux même te dire que c’est ce fichier (avec mon thème en tout cas):

https://www.pcinpact.com/images/clair/sprite-pci-2k12.png



Est-ce que le fait qu’il soit intégré dans d’autre page lui retire toute “valeur” pris séparément?



Si je demande à Google de me trouver le logo PCI et que je lui demande de l’afficher, est-ce qu’il doit m’ouvrir toutes les pages où le logo est utilisé où juste ce que je lui ai demandé, c’est à dire le logo, seul?







Faith a écrit :



Pour info, voilà ce qu’est un index:http://www.mediadico.com/dictionnaire/definition/index/1

Un index N’EST PAS une gallerie.





Si tu veux jouer sur les définitions :

http://www.oxforddictionaries.com/definition/english/index



Computing A set of items each of which specifies one of the records of a file and contains information about its address.









Khalev a écrit :



Si tu veux jouer sur les définitions :

http://www.oxforddictionaries.com/definition/english/index





Ce qui confirme bien ce que je disais.









Faith a écrit :



Ce qui confirme bien ce que je disais.





Je vois pas comment.





  • A set of items : un ensemble d’objets : jusque là ça va

  • each of which specifies one of the records of a file : si on élargie un poil le concept de fichier au web tout entier on se retrouve avec un ensemble d’enregistrement qui spécifient un objet dans le web (dans le cas d’une image une miniature permet effectivement de spécifier un objet, surtout dans le cas où il faut que ça soit compréhensible par un être humain)

  • and contains information about its address : et ça c’est l’url de l’objet, donc de l’image.





    Ils ne disent pas les endroits où les objets sont utilisés, ils disent l’adresse de l’objet “its adress”.









Khalev a écrit :



A set of items each of which specifies one of the records of a file and contains information about its address.





Dans un index, le “item” est obligatoirement différent du “record of a file”.

C’est la base du concept d’index.

Si tu ne respectes pas cette règle, ce n’est pas un index, c’est une galerie, une exposition, une étagère.



Ce qui, de toute façon, n’enlève rien au fait que Google empêche le partage de trafic entre ses services et les fournisseurs de contenus. Les fournisseurs de contenus deviennent justes bons à payer la bande passante pendant que Google récupère tout le bénéfice.









Faith a écrit :



Dans un index, le “item” est obligatoirement différent du “record of a file”.

C’est la base du concept d’index.

Si tu ne respectes pas cette règle, ce n’est pas un index, c’est une galerie, une exposition, une étagère.





Ça tombe bien la “galerie” que tu vois sous Google ne contient aucune image originale, il contient que des miniatures et c’est quand tu cliques que tu vas voir l’image originale (c’est le principe des lien hypertexte là). Ce sont donc bien des “items” différent du record qu’ils désignent.





Faith a écrit :



Ce qui, de toute façon, n’enlève rien au fait que Google empêche le partage de trafic entre ses services et les fournisseurs de contenus. Les fournisseurs de contenus deviennent justes bons à payer la bande passante pendant que Google récupère tout le bénéfice.





Il n’y a pas pub sur les résultats d’images et techniquement quand tu cliques sur une image dans Google c’est exactement comme si tu chargeais uniquement l’image. C’est juste du javascript côté client et un get pour aller récupérer l’image sur le serveur d’origine, si on chargeait l’image originale directement la seule différence serait qu’il n’y aurait pas de javascript côté client, le get partirai de même et la réponse serait aussi grosse.



Allez, va





Khalev a écrit :



Ça tombe bien la “galerie” que tu vois sous Google ne contient aucune image originale, il contient que des miniatures et c’est quand tu cliques que tu vas voir l’image originale (c’est le principe des lien hypertexte là). Ce sont donc bien des “items” différent du record qu’ils désignent.





Mais bien sur…

Et dans une bibliothèque, tu as les livres écrits en police 4 qui servent d’index <img data-src=" />





c’est exactement comme si tu chargeais uniquement l’image.



Ce qui est impossible dans l’utilisation normale d’un site.

Quand on utilise normalement un site, on ne peut afficher une image qu’après avoir ouvert une page web de ce site.

Google brise le fonctionnement des sites, en exploite les ressources sans en partager les revenus.



Google n’est plus un indexeur depuis bien longtemps, Google est un centralisateur du Web. Le Web dont toute la philosophie repose sur le pair à pair se transforme inexorablement en minitel.

Et des gens qui devraient être éclairés en tant que fidèles de NXI/PCI arrivent à défendre ça ! c’est hallucinant !<img data-src=" />









Faith a écrit :



Allez, va

Mais bien sur…

Et dans une bibliothèque, tu as les livres écrits en police 4 qui servent d’index <img data-src=" />





C’est pas ce que j’ai dit. J’ai bien précisé que la miniature était utile dans le cas d’une image pour décrire l’image.

Dans le cas d’un texte un extrait ou un résumé peut-être suffisant.





Faith a écrit :



Ce qui est impossible dans l’utilisation normale d’un site.

Quand on utilise normalement un site, on ne peut afficher une image qu’après avoir ouvert une page web de ce site.

Google brise le fonctionnement des sites, en exploite les ressources sans en partager les revenus.





Euh… pour moi le fonctionnement normal d’un site c’est ça:

http://www.w3.org/Protocols/rfc2616/rfc2616.html

Dit moi ce que Google casse là-dedans?





Faith a écrit :



Google n’est plus un indexeur depuis bien longtemps, Google est un centralisateur du Web. Le Web dont toute la philosophie repose sur le pair à pair se transforme inexorablement en minitel.

Et des gens qui devraient être éclairés en tant que fidèles de NXI/PCI arrivent à défendre ça ! c’est hallucinant !<img data-src=" />





Alors là je ne vois pas du tout de quoi tu parles… Quand je récupère l’image grand format je la récupère bien depuis le serveur d’origine.



Remplace Google parhttps://searx.laquadrature.net/ si tu veux, le fonctionnement est exactement le même… <img data-src=" />









Khalev a écrit :



Euh… pour moi le fonctionnement normal d’un site c’est ça:

http://www.w3.org/Protocols/rfc2616/rfc2616.html

Dit moi ce que Google casse là-dedans?





Il faut être d’une mauvaise foi hallucinante pour résumer le fonctionnement d’un site web au protocole http. Les ergonomistes se pissent dessus de rire en lisant ton post.



Sur ce, bye, tout a été dit.









Faith a écrit :



Il faut être d’une mauvaise foi hallucinante pour résumer le fonctionnement d’un site web au protocole http. Les ergonomistes se pissent dessus de rire en lisant ton post.



Sur ce, bye, tout a été dit.





Bah je sais pas, source moi ce que c’est une utilisation normale d’un site alors.



Parce que perso je vois toujours pas où est le soucis à accéder à une ressource librement accessible depuis un index des ressources librement accessible.