Laisser l'IA apprendre : une position problèmatique

-------------------------------------------------

[07/04/2025] - ~6mins - # #

-------------------------------------------------

Je suis tombé sur cet article de blog : Laisser l'IA apprendre : une position éthique [1] et il m'a pas mal hérissé et donc j'avais envie de répondre.

Je sors donc mon clavier et c'est parti !

Richard Dern, l'auteur du blog raconte comment il est passé de méfiant à utilisateur réfléchi (mais bon à le lire je dirai même convaincu).

On arrive donc à la partie 4 titrée « Pourquoi se pose-t-on cette question ? » ; la question étant « Comment bloquer l'accès de votre site aux scrapers d'IA ? ».

Il énonce 4 raisons couramment données :

- éviter que son contenu soit réutilisé sans consentement,

- empêcher l’entraînement de modèles commerciaux à partir de données gratuites,

- lutter contre la perte de visibilité (l’IA répond à la place du moteur de recherche, sans rediriger l’utilisateur),

- et plus généralement, reprendre le contrôle sur la circulation de sa production intellectuelle.

Et il propose donc de retourner la question un peu différemment : *« Pourquoi autoriser les humains à accéder à un contenu et pas une machine ? »*.

Et enfin il la reformule de façon un peu plus explicite et complète : *« Pourquoi se bat-on pour interdire l’accès à une machine, alors qu’on laisse librement n’importe quel humain — bien ou mal intentionné — consulter ce même contenu ? »*.

Et c'est là que je vais commencer à répondre !

*Rien que l'utilisation du terme "la machine" me gêne.**

Ça donne déjà l'impression que l'on parle d'une chose singulière avec une certaine conscience.

Et surtout ça fait complètement disparaitre tout ce qu'il y a derrière le terme en le simplifiant.

*Non, les IA génératives ce n'est pas "la machine".**

"La machine" n'est pas autonome et n'est pas un enfant ni même un animal qui apprend par lui-même et qui expérimente et découvre les choses.

Déjà il n'y a pas 1 machine, ce n'est pas une seule IA, mais un nombre de plus en plus important d'IA.

*Ensuite ce sont avant tout des logiciels et base de données packagés pour être vendus à une clientèle.**
Le but n'est pas d'aider les gens, c'est avant tout un business qui profite(ra) à leur propriétaire*.

Vendeurs d'IA == Vendeurs d'eau en bouteille

Non, une IA ne lit pas pour nous, comme le dit le blogpost.*

Une IA lit pour ses propriétaires.

*Quand ChatGPT sort une info qu'elle a lue sur un site ouaib, ceux qui en profitent en premier c'est OpenAI et non les utilisateurs.**

Et du coup refuser cette lecture ce n'est pas refuser la transmission, c'est refuser la captation capitaliste d'une info publique.

C'est refuser l'accaparemment d'un bien commun (ou presque) à des fins commerciales.

Tout ce discours est le même que pour le business des bouteilles d'eau.

Refuser à Nestlé l'exploitation d'une source d'eau ce n'est refuser aux gens qu'ont soif de pouvoir boire.

C'est refuser à une entreprise de capter un bien commun et de le commercialiser pour leur propre profit.*

Et **le pire c'est que l'article va tenter de faire culpabiliser les gens qui bloquent leur contenu**.

Les sites au meilleur contenu vont bloquer l'accès et donc les IA ne vont pas pouvoir s'améliorer.

Il faudrait vouloir contribuer à l'amélioration de ces logiciels pour le bien de tous (faut pas oublier que "tous" signifie les clients de ces vendeurs d'IA et non pas "tout le monde").*

Refuser de contribuer à l'amélioration d'un service tiers devient même "une faute intellectuelle".

Bha ouai parceque bon si Nestlé peut pas remplir ses bouteilles dans une bonne eau de source mais plus que dans les flaques de boues, ça va être de la faute des propriétaires des sources d'eau.

Honte à vous de veiller à ce que votre source soit propre, de ne pas la souiller, de ne pas la surexploiter et la tarir !

Rhaaaa vraiment cette réflexion m'exaspère au plus haut point.

*Ne pas vouloir participer à un business écocide, ultra capitalistique et qui va se merdifier à un niveau stratosphèrique est une forme de militantisme.** (on rigolera quand ils tenteront de rentabiliser le service et que les abonnements vont faire x10 en prix)

On ne devrait pas avoir honte de le faire bien au contraire c'est une fierté.

L'aspect légal

Bon, le point n°7 du blogpost concerne l'aspect légal.

C'est bien gentil mais j'ai pas spécialement envie de partir en bataille judiciaire avec chaque gaveur d'IA.*

Déjà parceque c'est ridicule, ensuite la toute puissante industrie du copyright n'a pas encore fait quoi que ce soit en ce sens pour le moment alors que c'est pas les derniers et qu'ils ont des budgets avocats qui dépassent au centuple tout le pognon que je gagnerai dans ma vie…

Et puis, il va faloir se battre en justice contre des dizaines d'entités extra-territoriales avec cette idée.

Bonne chance, mais j'ai une vie à profiter.

La conclusion de l'article

« Conclusion : laisser les IA lire, pour mieux nous servir »

Voilà quand Richard Dern dans sa conclusion dit "nous", il veut parler des clients de l'IA.

*Je ne vous doit rien à vous tous les clients de toutes les IA différentes qui trainent.**
J'en ai un peu rien à foutre que votre IA soit nulle et j'ai rien à y gagner qu'elle s'améliore.*

Et même au contraire, **pourquoi ça serait à moi de supporter les problèmes que causent les scrapers ?**

Pourquoi c'est à moi de payer les ressources systèmes et réseaux nécessaires pour enrichir ces machines ?*

Mine de rien ces gros relous de Facebook se sont amusés à scraper à mort mon ptit gitea auto-hébergé au point de bouffer 50% d'utilisation cpu… (et de le faire planter)

Je ne suis rien, mon gitea contient trois fois rien, tout du moins rien qui pourrait intéresser les clients de Facebook.

Et pourtant ça en vient à me faire consommer de l'élec et me plombe ma machine pour leurs beaux yeux.*

Et je ne suis pas le seul, *le nombre de personnes et même d'entités qui se plaignent du coût que ça représente est grandissant.*

Pourquoi ce serait au monde entier de devoir subir cela pour le profit d'une bande de prédateur capitaliste ?

Wikipedia a vu son trafic non-humains monter en flêche ces dernières années…

Non, les IA ne sont pas l'"intelligence collective" !

*"La machine" n'est pas un bien commun, elles appartiennent à des entreprises qui ne cherchent que leur profit.**

Bref

Ça me donne vraiment l'impression de voir le point de vue d'un client qui implore le monde entier de supporter les coûts pour son service.

*L'impact écologique des IA est catastrophique et il ne faut surtout pas oublier cet aspect à chaque fois qu'on parle de ça.**
Notamment les milliers de machines qui bossent pour créer ces bases de données ont impact délirant mais il y a également un impact sur tous les hébergeurs de contenu de l'Internet qui se prennent eux aussi une augmentation de 50% d'utilisation de ressources à cause de tous ces crawlers.*

Ce n'est pas un simple outil neutre pratique.

C'est avant tout une aberration écologique.

*N'ayez pas honte de ne pas vouloir contribuer à cette merde !**

Bloquez-les sans vous soucier de ces entreprises qui vous pillent.

Liens

[1] cet article de blog : Laisser l'IA apprendre : une position éthique (https://richard.dern.ovh/interets/informatique/2025/04/02/laisser-l-ia-apprendre-une-position-ethique/)

------------------------------------

🏠 Retour à la home

------------------------------------

[07/04/2025] - # #

------------------------------------

[>> Suivant >>] ⏭ Heretic

[<< Précédent <<] ⏮ The Order