Laisser l'IA apprendre : une position problèmatique

-------------------------------------------------

[07/04/2025] - ~6mins - # #

-------------------------------------------------

Je suis tombé sur cet article de blog : Laisser l'IA apprendre : une position éthique [1] et il m'a pas mal hérissé et donc j'avais envie de répondre.

Je sors donc mon clavier et c'est parti !

Richard Dern, l'auteur du blog raconte comment il est passé de méfiant à utilisateur réfléchi (mais bon à le lire je dirai même convaincu).

On arrive donc à la partie 4 titrée « Pourquoi se pose-t-on cette question ? » ; la question étant « Comment bloquer l'accès de votre site aux scrapers d'IA ? ».

Il énonce 4 raisons couramment données :

- éviter que son contenu soit réutilisé sans consentement,

- empêcher l’entraînement de modèles commerciaux à partir de données gratuites,

- lutter contre la perte de visibilité (l’IA répond à la place du moteur de recherche, sans rediriger l’utilisateur),

- et plus généralement, reprendre le contrôle sur la circulation de sa production intellectuelle.

Et il propose donc de retourner la question un peu différemment : *« Pourquoi autoriser les humains à accéder à un contenu et pas une machine ? »*.

Et enfin il la reformule de façon un peu plus explicite et complète : *« Pourquoi se bat-on pour interdire l’accès à une machine, alors qu’on laisse librement n’importe quel humain — bien ou mal intentionné — consulter ce même contenu ? »*.

Et c'est là que je vais commencer à répondre !

Ça donne déjà l'impression que l'on parle d'une chose singulière avec une certaine conscience.

Et surtout ça fait complètement disparaitre tout ce qu'il y a derrière le terme en le simplifiant.

"La machine" n'est pas autonome et n'est pas un enfant ni même un animal qui apprend par lui-même et qui expérimente et découvre les choses.

Déjà il n'y a pas 1 machine, ce n'est pas une seule IA, mais un nombre de plus en plus important d'IA.

Vendeurs d'IA == Vendeurs d'eau en bouteille

Une IA lit pour ses propriétaires.

Et du coup refuser cette lecture ce n'est pas refuser la transmission, c'est refuser la captation capitaliste d'une info publique.

C'est refuser l'accaparemment d'un bien commun (ou presque) à des fins commerciales.

Tout ce discours est le même que pour le business des bouteilles d'eau.

Refuser à Nestlé l'exploitation d'une source d'eau ce n'est refuser aux gens qu'ont soif de pouvoir boire.

Et **le pire c'est que l'article va tenter de faire culpabiliser les gens qui bloquent leur contenu**.

Les sites au meilleur contenu vont bloquer l'accès et donc les IA ne vont pas pouvoir s'améliorer.

Refuser de contribuer à l'amélioration d'un service tiers devient même "une faute intellectuelle".

Bha ouai parceque bon si Nestlé peut pas remplir ses bouteilles dans une bonne eau de source mais plus que dans les flaques de boues, ça va être de la faute des propriétaires des sources d'eau.

Honte à vous de veiller à ce que votre source soit propre, de ne pas la souiller, de ne pas la surexploiter et la tarir !

Rhaaaa vraiment cette réflexion m'exaspère au plus haut point.

On ne devrait pas avoir honte de le faire bien au contraire c'est une fierté.

L'aspect légal

Bon, le point n°7 du blogpost concerne l'aspect légal.

Déjà parceque c'est ridicule, ensuite la toute puissante industrie du copyright n'a pas encore fait quoi que ce soit en ce sens pour le moment alors que c'est pas les derniers et qu'ils ont des budgets avocats qui dépassent au centuple tout le pognon que je gagnerai dans ma vie…

Et puis, il va faloir se battre en justice contre des dizaines d'entités extra-territoriales avec cette idée.

Bonne chance, mais j'ai une vie à profiter.

La conclusion de l'article

« Conclusion : laisser les IA lire, pour mieux nous servir »

Voilà quand Richard Dern dans sa conclusion dit "nous", il veut parler des clients de l'IA.

Et même au contraire, **pourquoi ça serait à moi de supporter les problèmes que causent les scrapers ?**

Mine de rien ces gros relous de Facebook se sont amusés à scraper à mort mon ptit gitea auto-hébergé au point de bouffer 50% d'utilisation cpu… (et de le faire planter)

Je ne suis rien, mon gitea contient trois fois rien, tout du moins rien qui pourrait intéresser les clients de Facebook.

Et je ne suis pas le seul, *le nombre de personnes et même d'entités qui se plaignent du coût que ça représente est grandissant.*

Pourquoi ce serait au monde entier de devoir subir cela pour le profit d'une bande de prédateur capitaliste ?

Wikipedia a vu son trafic non-humains monter en flêche ces dernières années…

Non, les IA ne sont pas l'"intelligence collective" !

Bref

Ça me donne vraiment l'impression de voir le point de vue d'un client qui implore le monde entier de supporter les coûts pour son service.

Ce n'est pas un simple outil neutre pratique.

C'est avant tout une aberration écologique.

Bloquez-les sans vous soucier de ces entreprises qui vous pillent.

Liens

[1] cet article de blog : Laisser l'IA apprendre : une position éthique (https://richard.dern.ovh/interets/informatique/2025/04/02/laisser-l-ia-apprendre-une-position-ethique/)

------------------------------------

🏠 Retour à la home

------------------------------------

[07/04/2025] - # #

------------------------------------

[>> Suivant >>] ⏭ Heretic
[<< Précédent <<] ⏮ The Order