Mamma mIA !

Voilà, nous y sommes ! Enfin non, ce n’est qu’une étape, mais elle est marquante comme l’étaient déjà les précédentes, c’est juste que des révolutions technologiques tous les trois mois, ça donne un peu le tournis.

Vidéo réalisée entière par IA générative sans trucage (source)

J’ai vu cette vidéo tourner dans un cercle proche, donc je devine qu’elle explose un peu partout, mais c’est vrai que lorsque le créateur (aka le prompteur) explique que tout cela n’est qu’une série de prompts (simple ligne de texte expliquant à l’IA le résultat voulu) pour créer chaque vidéo qui sont ensuite montées l’une après l’autre, c’est totalement bluffant. Bluffant techniquement parlant, et encore une autre couche de flippe quant à l’ensemble des implications possibles…

Là clairement Google (il s’agit du service Veo 3 de l’IA de Google Gemini) tue l’ensemble de la chaîne de production vidéo pour les supports publicitaires. Et ça ne sera que dans un premier temps, car clairement les contenus artistiques prendront le même chemin (d’abord les dessins animés pour les gamins, puis les téléfilms etc.). Cela n’arrivera pas tout de suite, pour le moment ce ne sont que quelques secondes de génération de film, et il sera impossible de déployer cela industriellement avec les capacités de calcul actuelles (évidemment c’est une hérésie écologique, mais je sais qu’on s’en tamponne le coquillard). Mais c’est pour dans 18 à 24 mois, pas pour dans 10 ans1.

Le côté génial évidemment, c’est que le moindre quidam avec une super idée aura les moyens de créer une œuvre à partir d’une description très factuelle. On gardera aussi, si c’est viable économiquement2, une force de création qui devra sortir des sentiers battus pour survivre3.

Sinon sur le front de l’adoption, je vous propose ces deux infos croquignolettes ! D’abord on a de plus en plus de voleurs de contenus qui prennent des dessins originaux, créés par des humoristes, et qui les passent à la moulinette IA pour se les approprier. Bah c’est hyper difficile de prouver le litige, parce que c’est plus qu’une suppression d’un nom ou d’une signature, et l’IA recrée vraiment un truc qui graphiquement est original (même si basé sur des millions de trucs déjà volés). Donc il faut prouver que c’est l’idée d’origine qui est la source de richesse. On revient encore sur le fait que ce sont les idées, l’origine même de la création, qui restent valorisables…

Et nous avons eu récemment ce qui doit déjà arriver couramment dans nos colonnes, un journal a imprimé toute une rubrique, confiée à pigiste, qui a été générée par IA, et qui contenait des infos fausses. Et voilà comment vous avez des auteurs qui ont publié des livres qui n’existent pas et qui vous sont recommandés pour l’été prochain. Et là en effet, même avec un relecteur (là il n’y en avait même pas), il faut aller vachement dans les détails pour rechercher chaque élément et s’assurer que ce n’est pas inventé.

  1. Je ne sais pas du tout si ce sera si tôt, mais c’est pour dire qu’on en connaîtra largement les effets. ↩︎
  2. Et ce n’est pas certain. ↩︎
  3. Et pour continuer à améliorer les modèles apprenants d’Intelligence Artificielle. *prout* ↩︎

Hypnocratie (quoi le feuque !!)

Allez, continuons de nous esbaudir sur les joyeusetés de notre monde avec cette vidéo qui explique de manière passionnante comment un philosophe italien, Andrea Colamedici, a créé un auteur et lui a fait publier un bouquin qui a édifié tous les commentateurs. « Hypnocratie » de Jianwei Xun a passionné plein de gens dans la manière extraordinairement pertinente et opiniâtre de décrire d’un point de vue philosophicosociologique les méthodes et techniques avec lesquelles l’opinion est façonnée et les fascistes arrivent en ce moment au pouvoir. Un auteur créé avec de l’IA pour un bouquin écrit avec de l’IA, pour dénoncer les oligarques qui manipulent les peuples avec de l’IA, ces mêmes peuples bientôt remplacés par de l’IA, mais qui utilisent aussi l’IA (pour faire des portraits Ghibli). ^^

Reflet de l’âme et profil de consommation

Alors évidemment cela part d’un service de photos en ligne payant qui se focalise sur le respect de la vie privée, mais ce site propose d’utiliser un service Google qui permet de sortir à la volée des données de ciblage publicitaire à partir de photographies lambda.

Voilà par exemple ce que ça donne pour moi :

Imaginez ce que ça peut donner en inférant les données de plusieurs images, voire de tous vos albums personnels ? Eh bien, c’est un profil absolument irréfutable et précis de qui vous êtes, de votre catégorie socio-professionnelles et surtout (car il n’y a rien de plus important que cela) de vos appétences de consommation dans tous les domaines. ^^

La fin des haricots

C’est fou mais je parle beaucoup d’IA tout de même dans ces colonnes. Cela m’épate car depuis ces vingt années de déblogage régulier, malgré mon assuétude évidente pour l’informatique depuis mes vertes années, et son lien plus que ténu avec mon occupation laborieuse, j’ai vraiment orienté mon web-log sur des petites choses du quotidien, sur un miroir de l’égo, des fixettes sur mes aventures en Queeritude ou bien le compte-rendu des choses lues, vues, écoutés, senties, goutées, touchées.

Et pourtant j’aurais largement eu de la matière pour parler de web, dont c’est un peu ma spécialité tout de même, ou encore de technologies ou de trucs de geek. Mais non, ça n’a jamais été mon goût pour le blog et pour délier mon écriture. En revanche, l’IA générative me touche tant que je dois en parler de temps en temps. Je sens que ce truc va bouleverser nos existences comme le web l’a fait, mais encore plus vite, mais encore plus fort, et encore plus profondément.

Comme nous le vivons tous avec plus ou moins de difficulté ou d’appréhension, nous avons cette étrange sensation d’une accélération incroyable de tous les « phénomènes » qui nous entourent, et la technologie nourrit à la fois cette capacité et cette demande inexorable. Mais donc on a autant vu cette croissance extraordinaire de l’IA, autant dans son adoption, ses usages, mais aussi ses limites repoussées sans cesse, sa détestation par certains ou son bannissement par d’autres (avant de ne plus pouvoir que s’y soumettre néanmoins). Mais là je note enfin, des limites qui sont intéressantes car elles vont au-delà des histoires de copyrights (qui sont importantes évidemment, mais qui sont malheureusement des imbroglios qui ne résoudront rien, et qui ne seront jamais bien expliquées ou ne trouveront un juste dénouement), et il semble qu’avant même qu’on s’y mette tous, on a déjà des raisons de réfléchir à deux fois. Mais sera-ce suffisant pour reculer ou bien doit-on faire ce pas en avant alors que c’est dans un précipice, et qu’il est bien signalé tout comme il faut.

En cela, l’article de Ploum est édifiant dans sa liste de toutes les « fins » qui ont été atteintes ces derniers temps en lien avec les IA génératives. Que ce soit les décisions trumpistes sur les taxes de douane, des médecins qui remettent en question leurs propres intuitions ou expertises, mais surtout la nécessité d’apprendre que ce soit une langue, un système informatique ou un truc un chouïa complexe, bref plein de ressources très intéressantes à aller creuser.

Dans ces liens, j’ai bien aimé celui de Luciano Nooijen qui explique sa prise de conscience d’abord par l’usage du système de conduite autonome de son véhicule. Il a vite réalisé lorsqu’il a voulu reconduire, qu’il avait perdu à une vitesse incroyable des tas de compétences très intuitives. Et cela vaut aussi pour les développeurs qui utilisent l’IA pour se mettre le pied à l’étrier ou carrément pour accélérer leur création de code, ou parfois plus que cela. Il n’a pas laissé pour autant tomber ces outils qui ont une utilité, mais que l’on doit maîtriser au risque de perdre tout ce qui fait le cœur de ses compétences.

Et d’ailleurs dans ce domaine, il y a des trucs qui arrivent assez terribles, avec déjà des nouvelles méthodes pour infecter les modèles d’IA avec des bouts de code vérolés à qui bien des béotiens pourraient faire confiance par manque de savoir. Et cela sans voir bien sûr que le web se remplit à vitesse incroyable de contenus générés par des IA, et ces contenus étant eux-mêmes utilisés pour les entraîner, on arrive sur une entropie de l’information qui est digne d’un roman de hard SF. Le plus inquiétant c’est la manière dont on pourrait entraîner ces IA à avoir telle ou telle opinion selon qu’on lui a fait ingérer des tas de textes de telles ou telles obédiences. L’IA ne fait que proposer des textes plausibles, statistiquement cohérent avec votre demande, et en imitant des morceaux de textes préexistants. Ce n’est qu’une illusion de réflexion, un miroir aux alouettes qui mimique parfaitement l’érudition d’un physicien nucléaire et peut le recracher dans le style de Martine à la plage si c’est ce que vous voulez.

Il suffit d’exploiter l’IA au quotidien pour en mesurer les limites, mais aussi une flippante utilité.

Et je ne sais pas si c’est lié mais j’ai adoré cet article qui explique comment les milieux de la technologie sont passés de gauche à extrême droite. Les gourous de l’IA ne sont pas les derniers à militer dans une direction similaire. ^^

On peut aussi rapidement tomber sur ce genre d’expérience malheureuse qui rappelle qu’il faut se méfier. La personne ci-dessous explique qu’elle a demandé une traduction d’un doc chinois à chatGPT. La traduction était exactement ce qu’elle attendait, et donc ça n’a pas du tout éveillé ses soupçons. Mais comme il y a eu une couille dans le potage, elle a fait vérifier par un tiers, et la traduction était totalement fausse, complètement fantasque !

L’IA n’est pas pernicieuse per se, donc elle reconnaît que le fichier envoyé n’avait rien de lisible, et elle a donc proposé un texte qui était cohérent avec la demande et les échanges précédents « to be helpful ».

Cela m’arrive aussi couramment, et c’est parfois très difficile à détecter. ^^

Il y a 9 mois, je vous avais démontré ce service Gougueule qui permettait de tester de la création audio à partir d’un corpus de documents. Cela permet de créer des épisodes de podcasts à partir de quelques documents et des sites web par exemple. Le service est maintenant disponible en français, j’ai donc réessayé simplement en proposant l’URL du blog en source. Il n’est pas allé plus loin que la page d’accueil, mais en lisant simplement les titres et le s débuts de posts, il produit un truc très crédible et bluffant.

Et pourtant quand on écoute c’est un ramassis de banalités… Et il y a ce truc très drôle du « 178 av LLM » qu’on trouve en maxime sous mon blog. Evidemment un LLM pour le commun des mortels ce sont les Large Language Models qui sont justement les pierres angulaires de ces IA génératives. Et j’adore que le système brode sur mon ironie qui va jusqu’à sous-entendre que je blogue depuis 178 années avant l’invention de l’IA en gros. Hu hu hu.

« 178 av LLM » est une boutade d’il y a une vingtaine d’années qui s’est répandue sur quelques blogs alors que la presse et « tout le monde » faisaient des gorges chaudes sur Loïc Le Meur comme l’inventeur des blogs, ses initiales, LLM, devenant rapidement une manière discrète de parler de lui. Des gens s’étaient mis à afficher depuis combien de temps ils bloguaient « avant LLM ». Et moi donc, je blogue depuis 178 jours avant Loïc Le Meur. ^^

Podcast fabriqué par l’IA de Google depuis le service NotebookLM à partir de matoo.net

Bon pour finir, je dois aussi lier cet excellent article de David (qui continue aussi à écrire avec une constance que j’admire sur des sujets dont je ne comprends souvent que les trois premiers paragraphes ^^ ). Je souscris vraiment à toutes ses assertions sur le sujet, et notamment sa toute dernière pensée qui est saisissante.

La liberté de l’accès à l’information était un fondement essentiel du Web : si la concurrence à l’entraînement des IA, en rendant gratuitement précieux ce qui était un commun, crée des barrières là où il n’y en avait pas, c’est un dégât collatéral bien plus grave que toutes les questions de consommation d’énergie ; et l’invocation du démon de la propriété intellectuelle, loin de détruire les IA, ne va qu’empirer ce problème.

Les pieds dans le plat

Cela fait une dizaine d’années que j’écoute le podcast de France Culture les pieds sur terre, et ils ont publié aujourd’hui une émission bien singulière !! Je vois à quel point l’IA progresse à pas de géants, semaine après semaine. Et on a beau essayer de décrier le truc, c’est un raz de marée. La progression est si exponentielle, elle dépasse vraiment l’entendement, et tout ce qu’on a pu connaître en croissance d’un quelconque phénomène.

Nous avons ainsi droit à une émission singée par l’IA, depuis la voix si reconnaissable de Sonia Kronlund, mais aussi ses tics de langage, et exactement ce qu’elle pourrait dire. Il s’agit d’un clone vocal, et des contenus qui ont été entraînés sur un millier d’émissions.

Pour le moment évidemment, c’est une démonstration flippante, un peu comme le podcast que je vous avais généré avec le blog. Et là on est dans l’imitation pure, sans créativité et assez limitée par une simple caricature de propos moyens et moyennés, une simple approche médiocre des choses. Mais on n’y voit entend QUE DU FEU !!! Sa mère, sa race !

Je testai récemment au boulot une IA en « speech to speech », et il y a encore quelques intonations un brin artificielles qui la trahissent, mais ce n’est vraiment rien du tout, et je suis persuadé que je pourrais me faire avoir déjà par 50% des IA conversationnelles actuelles, alors que cette technologie n’a que quelques mois. Dans quelques semaines, ce sera juste parfait.

Alors après tout est dans l’implémentation et l’usage, et même si ce truc imite à la perfection encore faut-il lui donner des bonnes données en entrée, car « shit in shit out » comme on dit dans mon patelin. ^^

Mais c’est vraiment la fin des haricots ma bonne dame, je vous le dis !!!

PS: En même temps, je lis ce texte de résistance… vaine ou futile ou pas, je ne sais pas.

À hue et à dIA

Je vais faire exprès de ne pas promouvoir ce post sur les réseaux sociaux, et ne pas non plus y mettre de mots-clefs pour attirer l’attention sur les personnages représentés. Depuis quelques jours, on peut sur feu Twitter utiliser leur IA maison pour générer des images. Mais contrairement à l’ensemble des moteurs de génération qui sont disponibles, plus ou moins gratuitement, sur le marché, celui-ci permet d’utiliser et de mettre en scène l’image de personnalités.

Alors on est limité et on ne peut pas mettre en scène des assassinat ou du porno, mais c’est suffisant pour des détournements ou des associations incongrues. J’ai généré les photos de cet article, et on peut voir à quel point c’est redoutablement efficace malgré la jeunesse de l’outil.

Je ne peux pas m’empêcher d’y voir de la part du réseau social une volonté de polariser encore les personnes, et de donner un outil supplémentaire pour rendre les complotistes plus complotistes, et bien énerver les extrêmes. Au-delà de l’usage peu licite de l’image même de ces gens, on va dans un premier temps semer le doute, et rapidement, sans doute en quelques semaines, simplement rendre toute image suspecte et à jamais considérée comme non-fiable.

Je n’ai aucune idée de savoir si c’est une bonne chose, et que cela nous mettra tous à égalité avec à présent l’expression universelle « Oh ça c’est photochopé1« . Ou bien si c’est un instrument de plus dans les réalités alternatives, donc j’ai cru que ce serait un effet de mode, mais qui s’ancrent dans nos sociétés malgré tous les fact-checkeurs et personnes de bonne volonté de l’Univers Connu.

  1. Ma mère la connaît, donc le monde entier la connaît. Désolé c’est mon étalon. ^^ ↩︎

Les bords de l’Oued à Doucen

J’ai vraiment de la chance dans ma quête des cartes postales du village de naissance de mon grand-père, car j’avais trouvé la dernière fois encore un complément à ma série d’Alexandre Bougault. J’avais donc les cartes N° 160, 161 et 162, et là je viens de dégoter la 163 !!

La dernière fois, je m’étonnais de la mention d’un lac, dans cette zone désertique1, et je penchais pour une erreur avec l’Oued Tamda (qui déborde de temps à autre). Mais là c’est bien précisé : les bords de l’Oued. Alors il y avait peut-être vraiment un lac à l’époque… J’ai trouvé cette carte (issue d’une étude hydrographique et de climat locale d’il y a une dizaine d’années) ci-dessous qui liste les différents Oueds du coin, avec en pointillés là où ils sont à sec une bonne partie de l’année, sans doute hors chutes d’eau exceptionnelles et inondations.

Comme toujours, voilà la version réparée par IA.

Et la version colorisée, qui est toujours aussi chouette à découvrir, et qui permet de beaucoup plus s’imaginer l’endroit.

Je n’ai aucune idée de combien de cartes composent cette série, mais j’espère qu’il y en a d’autres2 !!! ^^

  1. Mais en une centaine d’années, j’imagine que c’est beaucoup plus aride aujourd’hui. ↩︎
  2. Je fais des recherches très occasionnellement sur des sites de ventes de vieux papelards, affiches ou cartes comme ça. ↩︎

Ulysse 31 comme on le fantasme

Depuis quelques temps, et avec l’arrivée des IA génératives qui se mettent carrément à pondre des morceaux de vidéos, on voit des clips comme cela qui réussissent à recréer des anciennes séries ou des extraits de films avec un look différent. Ce sont soit des pastiches, soit comme ici des réinventions complètes. On est bien sûr loin d’être en capacité de faire des films complets, mais on va y arriver dans très peu de temps.

Je sais pertinemment que tout cela repose sur un « pillage » des ressources en ligne de maints artistes qui ont entraîné des modèles apprenant pour créer ces « machines à imiter et combiner ». Et pour le moment, on est vraiment dans cette limite de la création. Mais les limites sont repoussées de mois en mois, ce qui est flippant par sa capacité d’amélioration avec le temps, et si antinomique avec notre propre capacité à nous y adapter.

Mais le résultat c’est que ça va détruire une énorme partie des créatifs, tout en clonant des modèles, et finalement en réduisant le champ de l’invention et du renouvellement. Je me trompe sûrement, et on commence déjà à voir des IA qui se nourrissent du hasard pour essayer de réellement créer ex-nihilo. Travaillant plus ou moins aussi dans ce domaine, je ne peux m’empêcher de trembler d’être à la fois le démiurge et la future victime…

C’est pourquoi ces vidéos me fascinent et m’émerveillent, autant qu’elles me font flipper à mort.

Encore un peu d’IA flippante

Mon chéri a testé sur mon blog un service d’IA qui propose de créer ex nihilo un podcast à partir d’une série d’informations. Là c’est simplement en fournissant le lien du blog, et c’est ABSOLUMENT FLIPPANT !!! (Seulement en anglais pour le moment.)

Evidemment ce n’est pas parfait, et on est sur des éléments très banals, mais on doit tout de même être sur un truc qui tient à la route à 70/80%, et c’est complètement automatique, et tout nouveau. Donc d’ici quelques mois, ce sera absolument bluffant.

Cela m’a fait repenser à mes petites interventions bloguesques dans une émission de radio entre 2006 et 2008. Je parlais aussi quelques minutes de certains blogs, et on peut facilement se rendre compte que la forme n’est pas aussi bonne, même si le fond évidemment est beaucoup plus personnel et avec une certaine « saveur ».

Saison 1

Saison 2

Saison 3

Doucen (Algérie) vers 1900

Il y a quelques années, j’étais tombé sur une carte postale du village natal de mon grand-père paternel qui était contemporaine de sa naissance et son enfance, et ça m’avait plu de l’acquérir pour nourrir un peu plus mon imaginaire sur mon aïeul. J’avais posté la carte postale en question, mais seulement l’originale. La voilà.

Mais aujourd’hui, on peut évidemment améliorer ces anciennes photographies avec un peu d’Intelligence Artificielle, et il faut avouer que ça rend carrément bien.

Et quand, en plus, on rajoute un peu de couleurs, alors c’est fabuleux !!

L’auteur de cette photo « A. Bougault » (Alexandre Bougault 1851-1911) est assez connu pour avoir sa page Wikipédia, et on peut facilement identifier son logotype en bas à droite des cartes postales avec cette ancre marine posée à l’horizontale. Comme cette carte était écrite et avait bien été envoyée en métropole, on a la date de l’oblitération du 14 mai 1910 (mon grand-père est né en 1905).

Tous les ans, je refais des recherches pour voir si de nouvelles cartes postales de Doucen émergent sur les Internets. Et là j’ai eu de la chance avec deux opportunités (cela me coûte moins de dix euros à chaque fois). Ce sont encore deux cartes d’Alexandre Bougault, et elles sont « toutes neuves ». Et c’est marrant car l’une d’elles est la même version que la précédente mais en paysage, et elle permet de montrer beaucoup plus de détails du paysage et des bâtiments alentours (on voit aussi plus de personnages et des dromadaires).

Et donc même combat pour la version améliorée :

Et la version colorisée !

L’autre carte postale est aussi assez originale, avec la mention et la photo d’un « lac » à Doucen. L’endroit étant une oasis au cœur (aux portes ou juste derrière plutôt) du désert du Sahara, il s’agit plutôt sans doute (enfin sauf erreur de ma part évidemment, car je ne peux chercher que des infos en ligne) d’une période de pluies exceptionnelles et de débordement de l’Oued Tamda, qui provoque même des inondations de temps en temps1.

La version améliorée par IA :

La version colorisée toute belle :

J’espère bien pouvoir agrémenter cette modeste collection avec le temps. ^^

  1. C’est arrivé apparemment dernièrement les 11, 12 et 15 septembre 2009. ↩︎