MiroShark EXPLOSE MiroFish (test en direct)
By Meydeey | Automatisation IA
Summary
Topics Covered
- MiroShark dépasse MiroFish : zep dependency eliminated
- Simulation IA : prendre des décisions stratégiques éclairées
- Base mémorielle IA : destroy tes concurrents
- La norme de mai 2026 : une simulation par jour
Full Transcript
Bon, tu as certainement déjà entendu parler de MiroFish dans une de mes vidéos.
Si ce n'est pas encore le cas, eh bien, ça va arriver.
Pour être totalement transparent avec toi, j'étais en train de faire une vidéo spéciale pour les CEO, ça faisait 2h41 que j'étais en préparation en tournage, mais Mirofish m'a énervé parce qu'il y avait des bugs dans tous les sens.
Il m'a rendu fou, donc j'ai creusé et je me suis dit qu'est-ce qui peut être meilleur ?
J'ai trouvé une pépite de uniquement 838 stars sur GitHub qui s'appelle non pas Mirofish mais MiroShark.
Donc c'est ce qu'on appelle un fork de Mirofish.
Il a été en quelque sorte dupliqué et puis customisé.
Donc du coup, ce n'est plus un poisson, c'est un requin.
Il a l'air exceptionnel.
Sur le papier, il va corriger toutes les erreurs que j'avais sur Mirofish et je peux t'assurer que ça m'a bien emmerdé.
Passer 3h pour rien, ça ne faisait que bugger pour aucun livrable au final.
Bien sûr, je te fais une présentation après pour t'expliquer le contexte exactement de où est-ce qu'on va se diriger dans cette vidéo, mais on va utiliser une solution qui s'appelle Neo4j et elle met une pilule de très loin à ZEP.
Donc si tu connais ZEP, ZEP Cloud, on l'utilise pour Mirofish et pour par exemple des bases mémorielles, donc ce qu'on appelle du graph où il y a des relations avec des connexions entre des boules.
Mais grâce à MiroShark, ça nous enlève une énorme épine dans le pied.
L'interface de MiroShark, elle ressemble à ça.
Elle est un petit peu différente.
On peut mettre nos fichiers PDF, Markdown, TXT pour pouvoir lancer une simulation.
Il y a d'autres choses en plus qu'ils ont ajoutées et je vais le tester en direct.
Je ne l'ai encore jamais testé.
Eh bien, ils n'ont que 527 abonnés.
Donc on est vraiment sur du projet snipé.
Sur YouTube, il n'y a personne qui en parle.
Il y a un gars qui en a parlé il y a 4 semaines, mais il a fait un short de 26 secondes.
Donc il n'y a personne, personne qui en parle.
On n'est que sur le fichier.
C'est une exclusivité mondiale que je te propose là.
Tu m'excuseras pour la qualité de la présentation.
J'étais obligé de refaire une vidéo rapidement parce que ça m'avait énervé.
Je n'avais pas le temps de passer une matinée sur une vidéo.
Donc ça, c'est le contexte avec transparence totale.
Tu l'as déjà.
Donc lors de la simulation sur Mirofish que j'ai effectuée, en une heure, j'ai eu 120 erreurs dans la boucle.
Donc c'est exactement les logs que j'avais.
Il me faisait tout le temps request fail with error 500.
Il ne me faisait que ce genre d'erreur-là.
Je ne comprenais pas pourquoi.
Il n'y avait pas de détails dans les logs.
Ça rendait fou. Donc, problème numéro 1, l'endpoint graph en 500, un temporal engine figé et un saut de 8 rounds.
Donc en fait j'avais lancé 60 rounds pour la simulation et il a décidé de passer du round 23, il a sauté au 31.
Il a dit bon on va faire du 23 au 31 comme ça, alors que non, normalement tu les fais tous.
Et si tu check pas, tu te retrouves avec un rapport final qui va être biaisé, avec une donnée qui va pas être qualitative et qui va être corrompue.
Et ça on le voit pas en général, un gars qui lance, qui part, qui revient, deux heures après qu'il voit que c'est terminé, il voit pas qu'il y a eu un saut entre les rounds.
Et le responsable de tout ça c'est ZepCloud, c'est encore une dépendance qu'on va dégager dans cette vidéo et qu'on va remplacer par Neo4j.
Donc ZepCloud, forcément il y a des rate limits, donc pour les requêtes, ils sont saturés.
Donc en fait les erreurs 500 et tout type d'erreurs que j'ai pu avoir, c'est qu'on faisait trop de requêtes, il fallait patienter.
Après il y avait la limite des comptes et tout, c'était chiant.
Donc l'outil que je vais te présenter a été forké et du coup enrichi par Aaron J. Mars.
Il est en anglais, il a été sanitisé et il est spécialisé avec Open Router natif.
C'est ça qui est puissant, c'est que du coup Open Router ça fait partie de ma stack principale et là c'est un outil Open Router like.
Plus Neo4j en local, donc toutes mes données en local et non pas chez Zep, c'est parfait ça.
En plus Mirofish, l'original il est en chinois, donc la mémoire elle dépend de ZepCloud.
C'est tuné par Kuen, donc il y a des cassages quand tu fais des requêtes API avec certains modèles.
Lui elle est chinoise, si t'as pas vu ma première vidéo sur Mirofish, je t'invite à aller la regarder, c'est celle-ci.
Un étudiant de 20 ans a créé l'IA numéro 1 sur Github Mirofish.
Et on voit dans cette vidéo que des fois il génère des personas en chinois et ça on va dire pollue un petit peu la qualité de réponse finale.
Le setup il est plutôt complexe pour la plupart des gens, surtout en fait la couche Zep qui est chiante.
Reconnecter une couche en plus Zep c'est pas dur techniquement à faire, on peut le dire à Cloud Code il le fait ok.
Mais c'est encore une couche en plus qui est chiante.
Et là le fork comme je te l'ai dit, Neo4j en local, zéro dépendance externe, tout va se passer sur notre machine.
Open Router natif, génial pour les LLM.
Anglais nativement, le code il est propre.
Il y a des petites différenciations mais je ne vais pas trop rentrer dans la technique.
Ça c'est pour mes membres en interne dans le labo IA qu'on va le décortiquer.
Donc Neo4j en local, plus jamais de Zep sur Thames.
Machine en local first, Neo4j CE, les graphes sont illimités, donc pour faire des bases mémorielles, pour faire des bases mémorielles d'entreprise, de clients, de processus, SOP, etc. C'est vraiment démentiel et c'est surtout stable.
On va éviter les erreurs qu'on a pu avoir à cause de ZEP. A quoi ça va servir pour le business ? Ça va
principalement servir à faire de la simulation. Je m'adresse au CEO pour simuler une réaction publique, simuler une nouvelle offre, simuler un pricing, prendre une décision stratégique qui est on va dire critique, le recrutement clé, un pivot, un partenariat, un alignement sur un marché.
Pour aussi le trading, je sais qu'il y en a en interne qui font du trading, il y a un développeur sur Polymarket, il a utilisé Mirrorfish à l'époque, il a fait 4266 dollars en 338 trades. Bon, nous n'avons pas la preuve qu'il a vraiment fait avec Mirrorfish,
338 trades. Bon, nous n'avons pas la preuve qu'il a vraiment fait avec Mirrorfish, mais voilà, tout ça c'est juste une question d'utiliser l'IA pour générer de l'argent.
Nous générons tous de l'argent avec de l'IA. Il y a aussi un bel avantage, c'est le rapport coût résultat, donc ils ont un système de presets, donc de préconfiguration qui est cheap, donc qui n'est pas cher du tout, et ça prend uniquement 10 minutes, et ça ne néglige pas la qualité.
Allez, c'est parti, on ne perd pas de temps, on va le tester directement. Et je vais être transparent avec toi, erreur ou pas erreur, il n'y aura aucun souci. Là, on va tailler la pierre.
directement. Et je vais être transparent avec toi, erreur ou pas erreur, il n'y aura aucun souci. Là, on va tailler la pierre.
Alors, maintenant qu'on est ici, que je l'ai installé en local sur ma machine, je vois qu'il y a des trading, tu vois, il y en a qui font ça, PudgyPinguin, alors ça je crois que c'est des débiles.
Bitcoin funding, par exemple, pour la cryptomonnaie, faire de la simulation, c'est vraiment génial, sur des marchés avec des variables, bon c'est un peu des conneries ça, on va se préparer à un vrai truc business là, c'est n'importe quoi ça. Allez, super, j'ai trouvé l'angle qu'on va utiliser, ça va être la restructuration d'équipe en squad cross fonctionnel, c'est à dire, le pitch il est simple, on a un CEO qui a une
boîte de 100 personnes, qui décide de casser des départements, donc marketing, sales, produits et développement. Et ce qu'il veut faire, c'est créer 8 squads cross fonctionnels, par segment client, et il veut savoir la réaction sur 90 jours de cette modification.
Pourquoi ça va marcher ? Parce que c'est une décision lourde, et elle est fréquente, quand on veut scaler son entreprise, qui va perdre du pouvoir, manager de département, versus qui va gagner en autonomie, donc dans du coup, les 8 squads.
Il y aura une polarisation entre la fluidité et la perte d'expertise dans sa boîte et ça lui donnera un use case parfait pour qu'il puisse raisonner, prendre des décisions et pivoter son organisation comme il le souhaite.
Donc l'output qu'il veut, sachant que c'est un CEO, il ne veut pas gagner de l'argent avec l'IA, il veut quelque chose de plus solide, il veut en savoir plus sur la résistance des managers déchus, sur l'enthousiasme des juniors, la perte des référents techniques, le conflit sur la propriété des objectifs et les premiers signaux de recréation informelle des silos, sachant qu'il va partir sur, du coup,
8 silos. Donc c'est vrai que je ne te l'ai pas montré pendant qu'il est en train de préparer les livrables qu'on va lui donner,
8 silos. Donc c'est vrai que je ne te l'ai pas montré pendant qu'il est en train de préparer les livrables qu'on va lui donner, effectivement il y a des starter templates, ça c'est bien, il n'y avait pas ça sur Mirrorfish, c'est-à-dire que si tu veux tester une crise, tu veux tester un lancement de token crypto par exemple, ça c'est génial, pour le lancement d'un token crypto, l'analyse,
c'est vraiment très bien. Sur un débat politique, c'est encore autre chose, sur l'annonce d'un produit par exemple, l'annonce d'un nouveau produit dans ta boîte, dans ce que tu vends, même si tu es coach etc, c'est juste démentiel tout ce qu'on peut faire. En tout cas, je ne sais pas si tu arrives à comprendre à quel point c'est puissant et c'est le futur, le swarm agenting,
le swarm agents, et n'hésite pas à me donner un avis en commentaire de ce que tu en penses de ça, de pouvoir lancer des centaines d'agents, du moins là c'est plutôt des vingtaines, sur les templates je pense que ça va être plutôt des trentaines, mais on tend vers des centaines voire des milliers d'agents pour pouvoir nous aider à la décision et avoir
si tu veux un dataset, un jeu de données qui va nous aider en tant que CEO à prendre de meilleures décisions, à être plus éclairé et à voir si tu veux des zones d'angle mort que nous n'aurons pas eu, enfin du moins on l'aurait eu peut-être en un an, tu vois, à force de parler aux clients etc, t'es CEO, là je te parle en tant que CEO, voilà, t'as une boîte,
dans le même secteur que toi, tes concurrents, ils font la même chose que toi, mais ils travaillent à la main, ils ne raisonnent pas, il y a toujours les mêmes problèmes, les angles morts, et tu les connais par coeur, tu crées une base mémorielle de ton entreprise, tous les process, tu les stockes, tu les enrichis, en fait, si tu travailles IA complètement, tu balances ça, mais tes concurrents, tu les
tu les flingues en fait, tu les flingues, et de par cette optimisation, qu'est ce que tu vas faire ?
T'optimise bien ta boîte, ta structure, tes process, tes pôles, c'est à dire que tu fais peut-être 8 pôles à la place de 4, peut-être tu réduis, ça va dépendre encore une fois, du coup, bah t'économise, tu fais plus de marge, tu baisses tes prix, tes clients, ils viennent chez toi, plus chez tes concurrents, par exemple, ça peut être un allié
tu vas taper du plus haut ticket et tu vas avoir des clients de meilleure qualité donc pour la décision c'est moi je m'arrache la tête tous les jours avec ça je pense que la norme de mai 2026 ça va être de lancer une simulation par jour donc là Claude il est en train de préparer les livrables je regarde un peu ce
qu'il prépare donc mémo interne restructuration organisationnelle donc tu vois c'est du texte clair c'est la documentation ok simulation prompte donc on regarde un petit peu la structure donc il a un contexte de l'entreprise il a pourquoi cette décision très important ça c'est du contexte très précieux Nouvelle organisation donc organisation là c'est les huit squads donc il veut partir sur la squad alpha, bêta, gamma donc start-up tech
14 personnes, scale-up SaaS B2B, e-commerce et marketplace, fintech et insurtech healthcare et biotech, ET industriel, grands comptes, voilà CAC 40 et secteur public et défense c'est nickel donc tu vois il y a aussi des factualités il a inventé des noms, des vp là pareil, Elise, Marshall engineer chapter donc c'est très bien il y a de la factualité Là ça c'est quoi ça, les quatre personnes clés à observer donc il les a déjà
identifié, le calendrier, les risques identifiés par le head of people et ce qui n'est pas négociable bon ça c'est super maintenant le deuxième simulation prompt ça c'est le prompt qu'on va lui envoyer donc il m'a fait une version courte dans la box numéro 2 et la version détaillée on va pas prendre la courte on va prendre la détaillée donc il y a un contexte, une période de simulation donc on a la précision, plateforme à simuler, plaza
ok community donc dm, slack, random d'accord, conversation café putain il a vraiment tout précisé questions à éclairer pour le CEO voilà pour moi je parle pour toi aussi toi en tant que CEO si tu veux vraiment si tu as des questions et que tu veux être éclairé par rapport à celle ci tu peux et le livrable final un rapport de prédiction structuré verdict de viabilité succès mitigé échec avec score de confiance top 5 des dynamiques émergentes
tu vois c'est pas vraiment déterministe dans le sens où tu as quand même ce libre arbitre de choix top 5 des dynamiques émergentes c'est pas juste quelle est la meilleure solution et je dois prendre celle ci tu vois il y a une nuance liste nominative des départs trois scénarios possibles probable optimiste pessimiste et recommandation actionnable par antoine allez c'est parti on prend le prompt là j'ai touché à rien
j'ai mis du deep sick v4 pro c'est du très solide voilà nickel alors tu vois si t'as pas de documents tu peux poser des questions et faire de la recherche et tu peux aussi mettre des url pour qu'ils puissent fetcher, aller récupérer les infos mais nous on est professionnels, on sait ce qu'on veut, on fait pas à l'arrache comme ça. Donc on va télécharger le
Solidar Restructuration Squad, on lui donne à manger, donc bien sûr on peut en mettre plusieurs mais là on va rester sur un seul, on l'a déjà vu à peu près la structure. Il prépare un setup, tu vois Smart Setup, donc il prépare les
la structure. Il prépare un setup, tu vois Smart Setup, donc il prépare les scénarios du... Ah bah voilà il l'a préparé tout seul, génial. Alors ça c'est
scénarios du... Ah bah voilà il l'a préparé tout seul, génial. Alors ça c'est très bien ça, ça on n'a pas ça sur MirrorFish et c'est vraiment meilleur, on passe, on a une meilleure expérience, on sait mieux où est-ce qu'on va en fait.
Et là on peut choisir, choisissez un ou redéfinissez le vote. Ok, alors est-ce que Solivar's employee headcount drop below 19.5, ok, est-ce que la rétention de revenu va atteindre 120% pour le Q3 2026, ok, donc là en fait on peut choisir suivant un scénario beer, donc un scénario négatif, un scénario boule, c'est comme en crypto, un scénario qui est ultra positif, un positif et
un neutral qui est un neutre. Franchement on va partir sur le beer, voilà on va utiliser celui-ci, donc j'ai cliqué, je teste pour la première fois. Alors une
fois que j'ai cliqué, ah oui d'accord il rajoute un texte en dessous, mais par contre mon prompt il est où là ? Il me l'a dégagé. Ok, en fait le texte, il s'est basé sur le texte pour analyser et préparer ses trois choix, on choisit et quand on clique, tu vois, use this, ça change le texte en tout, tout simplement.
Et notre prompt il a été tout simplement induit dans ça. Bon, c'est pas forcément obligatoire, j'aurais pu laisser le prompt, mais on va partir sur le beer. Voilà, on va jouer sur le beer de
le beer. Voilà, on va jouer sur le beer de négativité. Très bien, on lance la simulation. Ah déjà l'interface elle est
négativité. Très bien, on lance la simulation. Ah déjà l'interface elle est plus agréable. Ok, donc maintenant qu'est-ce qui se passe ? Génération de
plus agréable. Ok, donc maintenant qu'est-ce qui se passe ? Génération de
l'ontologie, grand classique, donc il va préparer la structure des données, du moins ontologique. Alors je ne sais pas, je pense ça va être long quand même avec
moins ontologique. Alors je ne sais pas, je pense ça va être long quand même avec DeepSea IV 4, on va éviter de faire 500 000 rounds, sinon ça va prendre trop longtemps. Je vais me déplacer, sinon vous allez me tuer. Voilà, là c'est mieux.
longtemps. Je vais me déplacer, sinon vous allez me tuer. Voilà, là c'est mieux.
Donc tu vois, là on a même chose que Mirrorfish, génération ontologique qui est en cours, la petite animation. Tu vois, il a forké le projet et puis il a optimisé quoi, donc ça c'est génial, c'est bravo à l'open source, bravo aux chinois qui a créé ça. Il a créé des machines de guerre, je pense qu'il a même
créé ça. Il a créé des machines de guerre, je pense qu'il a même révolutionné le marché du Swarm Agency et lui du coup il l'a adapté avec Open Router, c'est un régal. Ok, là c'est terminé la génération ontologique, donc il a fait CEO, CTO, VP, Head of Department, Engineer. En bref, il a généré tous les types d'entités, ensuite les relations, donc Travail pour, Gère, Rapport à,
tu vois c'est pour pouvoir faire les relations entre tous les types d'entités.
Par exemple, le site CEO, Report to CEO, c'est ce qu'on va voir après dans le graphe qui va se générer normalement à gauche, si tout se passe bien.
Donc là pour l'instant il a fait 0 EntityNodes, donc ça c'est les nœuds qu'il va créer, les nœuds et puis les relations entre les nœuds, ça va nous créer un espèce de graphe sur la partie gauche.
Ok, donc là ça a changé, mise à jour en temps réel, c'est agréable.
Franchement, si ça marche parfaitement, ça va me changer mon quotidien, alors peut-être que vous n'avez pas encore le niveau de conscience, mais ne partez pas dans tous les sens, continuez, solidifiez vos process, les gars, les CEOs, que vous avez des boîtes, etc. Commencez pas à vous prendre la tête, sachez que ça vous allez en avoir besoin, mais voilà, ce n'est pas urgent pour vous.
Mais dans très peu de temps, pour prendre de meilleures décisions, vous allez en avoir besoin, ça va être nécessaire.
Donc évoluez tranquillement, une étape par une les gars.
Ok, donc là il commence à nous préparer le graphe en temps réel, on peut cliquer dessus et forcément on voit les détails des agents.
Donc là il a fait Thomas Lavoie, marketing, voilà, lui c'est un VP, donc il est en train de faire les relations, tu vois, il est en train de créer ça tranquillement en temps réel.
Franchement, ça a l'air fluide, je n'ai pas de bug, là c'est top nickel.
DeepSeek V4 Pro, là ça commence à faire plaisir, je pense que j'ai trouvé la pépite.
Donc il fait des relations, Elise, elle est quel profil ? Parce que du coup elle est reliée à pas mal de personnes, c'est ça qui est intéressant.
Elise, elle est CTO, c'est pour ça, tu vois, comme elle est CTO, elle est reliée à pas mal de personnes, donc c'est cohérent.
Donc là il a buildé notre graphe, donc on a un total de 33, alors ça c'est parfait ça pour la symbolique, on a 33 noeuds d'entité, on a 33 ponts, donc edge, ce sont des relations effectuées entre les ponts, tu vois, c'est les liaisons, tu vois, 1, 2, 3, 4, tu vois, c'est ça,
et les types de schéma on en a 10, ok, donc ici normalement, 2, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, c'est cohérent.
On n'a plus qu'à du coup changer, alors là tu vois prediction market, on peut choisir ici, alors ça c'est nouveau ça.
Est-ce qu'on veut le prédire sur 3 marchés ou est-ce qu'on veut le prédire sur 1 marché, 2 marchés, 3 marchés ?
Ah vous avez vu, c'est marrant parce que normalement sur Mirofish, c'est pas comme ça, on peut choisir le nombre de rounds.
Peut-être que je me trompe ou c'est après, ok bon on va laisser 3, on va laisser initialement tu vois 3, 3, on n'a que des 3 là, allez c'est parti 3.
Ok, donc maintenant il est en train de générer les profils des agents, donc il va créer si tu veux des personas très précis, je vais te montrer à quoi ça ressemble, si vraiment tu sors d'une grotte et que tu n'as pas entendu parler de ça, ce n'est pas grave, tu vas comprendre, dans les grandes lignes.
En gros pour faire une simulation qualitative, on ne va pas mettre que des gars qui pensent que l'IA c'est génial ou qui pensent que la boîte elle est géniale, on va mettre plusieurs types de profils, aux antipodes, plusieurs si tu veux MBTI, plusieurs profils MBTI, etc, etc.
Et ça ce qui est génial, c'est que ce que tu es en train de voir à gauche, c'est en train de se stocker en local, ça n'est plus sur ZEP, tu ne vas peut-être pas te rendre compte de ce que je suis en train de te dire à quel point c'est trop bien en fait, parce que ZEP n'aura plus accès à tout ce que je suis en train de faire là, et en plus ça tourne vite, c'est plus rapide, moins cher que dire de mieux.
En plus là c'est fluide, tu vois, on peut cliquer pour voir les labels, donc les ponts, si on regarde ici, Julien M commente on Elise, tu vois, en la CTO, j'ai l'impression que la qualité de la solution est meilleure en fait, elle est mieux interprétée.
Alors je n'ai pas encore décortiqué en interne, je le teste empiriquement comme ça, mais putain l'expérience, pour vraiment vulgariser, Mirofish, je lui mets une note sur l'expérience de 4 sur 10, lui je lui mets un 9 sur 10 pour l'expérience, la fluidité, la rapidité.
Par contre, où sont les logs ? Je ne vois pas, chez Mirofish ils sont en bas à droite, système dashboard, on va laisser tourner, on verra après.
Bon il n'y a pas l'air d'avoir de bug pour l'instant, là forcément on a 33 profils, donc la boîte est à 33 on va dire personnes, suivant le graphe, il va devoir générer avec DeepSeek V4, donc avec un raisonnement, 33 profils d'agents, tous différents.
Bon bien sûr il y aura de la qualité, mais ça prend quand même du temps, je peux vous assurer que là en interne, je sais très bien ce qui va se passer dans le labo IA, mercredi dans le prochain live, il y aura une masterclass.
Pendant que c'est en train de tourner, si tu veux nous rejoindre dans le labo IA, donc bien sûr premium et elite, pas gratuit, si tu es dans le groupe gratuit et que tu vois qu'il n'y a pas d'activité c'est normal, je n'anime pas cette partie là pour l'instant.
Et tout se passe dans la description, premier lien, ou sur le premier commentaire épinglé, tu as une page de vente, tu pourras voir les captures d'écran, les preuves des résultats des membres, l'avancement et l'offre surtout que je propose.
C'est une offre unique et là où c'est intéressant et j'ai mis à jour très récemment, pour ceux qui ont déjà vu la page de vente, c'est ici pour voir le programme complet.
Comment le programme se compose, il a été mis à jour récemment avec des nouvelles catégories comme par exemple l'art du prompt, comme par exemple agent et rag, comme par exemple mettre en ligne, comme par exemple juridique et contrat, kit d'exécution aussi, et pour les élites en cercle restreint haut de gamme, focus exécution au mental, l'effet levier et bibliothèque élite. Ceci tu le retrouves pas sur le marché, c'est totalement unique.
Alors il est toujours à 20%, là tu vois ce qu'il manque c'est quand même des logs, je veux voir qu'est-ce qui se passe, est-ce que ça plante, parce qu'on voit 20% depuis tout à l'heure, peut-être que c'est long, bien sûr il y a 33 profils, mais on a aucune vision sur l'avancement.
Après rien ne m'empêche de forker le projet et de faire cette modification et d'ajouter des logs, encore une fois c'est open source.
Ah ok alors regarde, on peut cliquer sur système dashboard, bien joué, en plus au moment où je clique ça est en train de bouger, 21%.
Donc tu vois en fait en cliquant ici, on a les logs qui s'affichent, par contre ça c'est pas très clair dans lui mais faut le savoir, bon on l'a découvert.
Allez nickel, 25%, il enchaîne, en fait je pense qu'il a raisonné énormément avec DeepSeek V4 Pro et là il est en train de les générer.
Donc il est en train de créer des pseudos, voilà pour commencer la simulation, Antoine 101, Codire 708, Inès Ferrand, si on clique par exemple sur Inès, ils sont tous différents.
Donc ce sont, tu verras dans ma première vidéo sur Mirrorfish si tu ne sais pas trop, c'est la même chose, c'est le même principe.
Donc on a son MBTI, on sait que c'est une femme, elle a 34 ans, elle habite en France, elle a la description de son personna, elle est sceptique, elle aime le design system, elle est dans la tech éthique etc. Il y a un détail de son background aussi avec du vrai détail textuel, en plus avec DeepSeek V4 Pro, la qualité qui en sort c'est vraiment bien creusé.
Et chacun aura son propre personna, d'où en fait la génération des profils d'agents diversifiés et pas du tout dans le même sens, pour pouvoir avoir si tu veux, des personnes qui sont d'accord, d'autres pas d'accord, d'autres sceptiques, d'autres qui sont pas du tout d'accord, et ça va créer on va dire une réponse plus enrichie, si tu comprends la logique.
Donc si on analyse les logs un petit peu, est-ce qu'il y a des bugs déjà ?
Pour l'instant je ne vois pas de bug.
Read 30 Entities, alors à chaque fois il les lit, ok, non il n'y a aucun bug pour l'instant, aucune erreur.
Ça tourne parfaitement. Je peux t'assurer que de l'autre côté, je me suis arraché la tête.
2h40 de tournage, jeté à la poubelle, allez ça dégage, on passe à autre chose là.
Et au final, est-ce que l'ordre provient du chaos ? Il y a des grandes chances.
Et franchement, je pourrais très bien faire une pause dans la vidéo le côté au montage, revenir en arrière, mettre un modèle plus rapide, mais je vous laisse quand même de la qualité pour le résultat final.
On va rester sur DeepSeek V4 Pro.
Ok, il a terminé les 30 agents, nickel, complété.
Il a généré aussi la configuration de la simulation, donc il estime à 72h la configuration, avec des rounds qui vont durer 60 minutes par round.
Il veut me tuer, je ne vais pas passer 72h à attendre, il a vraiment rêvé.
L'agent de configuration, alors qu'est-ce qu'il a fait ?
Codire, Hugo Bergé, ok, agent 1, agent 0, alors il y en a 30 bien sûr.
Donc tu vois, on voit les divergences entre les profils, influence 2.5, influence 1.
Lui, tendance de sentiment, il a 0, lui il a plus 0.2.
Lui, il n'est pas actif aux mêmes horaires que lui, donc il y a une vraie divergence et différenciation.
C'est pour ça que la qualité finale est énorme, ils sont tous différents.
Lui, il bosse beaucoup, Pierre le maître, allez Pierre, vous bossez.
Bon, donc ça c'est bon, maintenant l'activation initiale de l'orchestration.
Donc ça c'est ok, il va préparer l'orchestration de notre setup complet.
Donc ça c'est l'activation des séquences initiales, donc agent 2, agent 5, agent 4, agent 13, ok.
Et on peut venir déterminer ici, c'est comme MiroFish au final, ok c'est bon.
Et on peut customiser directement les rounds.
Donc là il nous recommande combien ? Il nous recommande 40 rounds.
Ok, par rapport à notre tâche, eh bien on va l'écouter, on va rester sur ça.
Alors on pourrait bien sûr appuyer et faire plus que ça, 70.
On va laisser 40 et puis on va lancer la simulation, c'est parti.
Ah ouais d'accord, c'est plus agréable l'interface là, ok, ah ouais j'aime beaucoup.
Donc là maintenant il va se passer des rounds, alors est-ce qu'on les voit bien ?
Alors tu vois la différence c'est qu'il a mis Polymarket, Reddit et X.
Ah ouais d'accord, ils ont carrément intégré Polymarket en natif, c'est des fou furieux.
Là les mecs sont dans la crypto, ils vont péter un câble quand ils vont voir ça.
Et encore, on parle de Polymarket mais ça peut être aussi le marché crypto traditionnel, faire de l'analyse fondamentale, uniquement fondamentale sur des projets, créer des entités et tout.
Je ne sais pas si vous vous rendez compte là en fait, tout ce qu'on faisait manuel.
ou semi-manuellement enfin semi-automatiquement avec des IA, woaw on tend vers un truc de fou, en tout cas je le dis ici mais sachez que ceux qui rentrent maintenant, ceux qui sont rentrés très tôt dans le labo IA vont bénéficier d'un pôle investissement, un pôle marché financier parce qu'on a des financiers aussi avec 30 ans d'expérience, on a aussi des traders, des banquiers d'affaires, des conseillers en gestion de patrimoine
donc niveau dimensions investissement, ce genre d'outils je te laisse imaginer à quel point c'est puissant, donc là bien sûr dans les logs il n'y a toujours pas d'erreur, ça tourne, nickel, simulation engine started, ok on peut mettre en pause, tiens ça c'est bien ça, on peut mettre en pause carrément, on peut voir les marchés, on peut voir le
directeur, les branches, on peut aussi skip au rapport, donc si jamais on veut skip lorsqu'on sera au round 17 par exemple sur 40 ok ça c'est un bon point, ok là ça commence à bouger, ça veut dire qu'il commence à travailler là vous allez voir un graphe final qui va être totalement différent de ce que vous avez, moi dans mon alignement suprême je sais
que mentalement je suis bien, c'est en local, c'est pas chez ZEPP, si j'ai envie de mettre des informations précieuses des variables, des constantes sur moi, sur mon business, j'ai pas envie qu'ils aient accès à ça ZEPP, alors je vais essayer de cliquer sur market, ah regarde ok, mais pourquoi ils ont mis le market comme ça, prédiction des marchés, alors là j'ai pas trop compris, influence, ça veut dire qu'en fait on peut
regarder ce qui se passe sur le marché de polymarket en même temps de faire ça, sa prédiction, non c'est bizarre ça, alors attends on peut cliquer dessus, on va essayer de cliquer partout là, influence, ah ouais il y a les influences entre les profils exceptionnel, Antoine il a beaucoup d'influence, on peut l'interviewer et tout, parfait, drift, là ça après ça va venir, pour l'instant il n'y a pas encore
il n'a pas encore bien travaillé, network, on voit qui a, ah ouais ok on voit le network comme ça, ah ouais ça c'est bien ça, on voit qu'Antoine il a du pouvoir, ok démographique, bon là pour le coup c'est vrai que polymarket c'est pas vraiment le plus adapté pour vous dans les boîtes, mais après vous comprenez il y aura des forks etc, par contre pour le marché
investissement c'est pas mal, il y a aussi un what if, donc ça c'est cool, on peut recomputer, on peut relancer un computing en en cochant des personnes, c'est terrifiant tout ce qu'on peut faire, directeur, on peut passer en mode directeur, donc là il dit quoi injecter un événement, un breaking event, imaginez Le CTO a démissionné, on peut mettre ça.
On injecte l'événement, putain on peut injecter l'événement en plein dans la simulation, qui va créer du chaos, et qui va du coup complètement changer le résultat final.
Et là les branches, c'est quoi ça ?
Branches contre factuelles.
Fork de CMM, forquer la simulation un round number pour une injection narrative.
Bon ça, j'ai pas envie de le tester aujourd'hui.
Comment on fait pour revenir où on était là ?
Le drift il est en train de travailler, ça y est.
Là tu vois en fait le drift ça va montrer est-ce que c'est bullish, est-ce que c'est neutre ou est-ce que c'est bearish.
On peut aussi skipper, tu vois là on peut skipper désormais, donc il y a un total de 55 événements.
Et si on clique sur X, ah oui d'accord on peut activer certains profits.
Putain mais en fait il y a beaucoup d'informations ici là.
Démographique aussi, ça c'est pas mal pour voir les genres, les âges, les pays, les acteurs.
Ça c'est pas mal ça démographique, pour voir la diversité de notre dataset en fait.
Est-ce qu'on doit pas en rajouter ?
Est-ce qu'il n'y a pas trop, si tu veux, de jeunes par exemple ?
Imagine il n'y a que des 18-24, on voit qu'il y a 80% de 18-24 dans une boîte, c'est pas génial.
Pourquoi pas injecter du 35-44 tu vois.
Ah il a carrément mis un subgroupe, il a mis aussi un point clé dynamique du sous-groupe.
Donc il a dit les agents femmes déployés sont à 0.76, plus bullish que les agents mâles, d'accord.
Donc là il commence à faire les relations, là on commence à voir du graph, regarde.
Hop, là on a Datadog qui s'est mis, voilà, Datadog France.
On a aussi Solivar, donc c'est une société organisation dans le type d'entité, c'est la société principale.
Ah il a mis Carrefour aussi, Carrefour, Carrefour Tech.
Bon on va le laisser tourner, pour l'instant ça se passe.
Et par contre ça, il n'y a pas ça, je viens de regarder, quand tu vas dans le network, on voit la taille des puces, exactement comme dans ZEP en fait.
Sauf que là c'est plus agréable, ZEP c'est un peu chiant.
Alors si j'appuie sur pause, il se passe quoi ?
Je teste, Stopping Simulation, ça c'est pas mal ça.
Ah ne me dis pas je recommence tout à zéro.
Ok, il a stoppé en temps réel, et comment je relance ?
Config, ah Resume, ok, on peut revenir ici, génial ça.
Putain ça il n'y a pas ça dans Mirrorfish, ça c'est bon ça.
Et là, pourquoi il me dit Completed ?
Ah non Resume ici, il y a un bouton Resume, ok.
Et là ça reprend, ça c'est bien on peut faire le rapport.
à priori en fait. C'est bon, on est retombé sur ce que je voulais. C'est en fait les conversations sur X, Reddit et PolyMarket.
Alors je vais voir un petit peu, il y a beaucoup de X là, c'est bien ça. Ah voilà Reddit, ok. Est-ce qu'il y a du PolyMarket ?
Ah ouais carrément. En fait, j'ai juste un bug, une incompréhension, je vais y travailler dessus, j'aurai la réponse en moins de 24 heures mais est-ce que ça a un réel intérêt d'intégrer PolyMarket comme ça, donc dans le marché de la prédiction, pas forcément crypto ou décentralisé, uniquement dans le marché de la prédiction, dans une boîte en fait ? Est-ce que ça apporte un plus ou est-ce que ça apporte du flou ?
Dites-moi en commentaire ce que vous en pensez, la dimension PolyMarket, mais putain il y en a qui vont brasser beaucoup d'argent avec ça, je peux vous assurer. Par contre, j'ai aucune idée d'où on en est là. Total Event, putain il n'a même pas fait un événement, il est à zéro là.
Regarde, on en a mis 40, parce qu'il doit résonner à chaque fois en fait, ça va être long. Donc ça, à mon avis, mettre un DeepSeek V4 Pro, c'était une bonne idée pour une tâche puissante mais pour une vidéo YouTube, c'était complètement con. Pourquoi j'ai fait ça ?
Et ça ne va pas me coûter cher en somme, ce n'est pas ça le souci mais c'est le temps en fait, ça prend beaucoup de temps.
Pourquoi pas mettre un Quen ? Il y a un modèle que j'ai pas mal testé, c'est un Quen 3. Alors attends, c'est lequel ? C'est le 3-235-B.
On va le trouver. Quen 3-235 je crois. Ouais, c'est lui. Lui, il est pas mal lui. C'est un modèle assez rapide et quand tu fais du Swarm Agents comme ça, il est pas mal. Il a pas mal de providers aussi, ce qui veut dire que c'est assez antifragile. Niveau performance,
il est en place. Et niveau utilisation concernant les étiquettes, eh bien, on va regarder un petit peu. Bon, il est 40e en Académie, en Santé 33, en Légal 27, Marketing 32, SEO 45. Sa meilleure place, c'est en Traduction, d'accord. En Science 50, ouais, il a pas des places exceptionnelles mais je pense que c'est un bon modèle pour faire du Swarm. A mon avis, c'est un bug, c'est pas possible, on n'a pas fait zéro événement,
c'est pas possible. Tu vois, là, ce qui aurait été bien, c'est d'ajouter une modification de modèle en cours. On peut faire des pauses, ok, mais pourquoi on peut pas modifier le modèle en fait ? Bon, déjà, les boules dans le network, elles commencent à grossir, on voit qui a du poids
dans... Ok, regarde ce qui est en train de se passer. Sur Polymarket, il y a carrément des achats en fait. Il va lancer des achats, tu vois, des ordres d'achats
dans... Ok, regarde ce qui est en train de se passer. Sur Polymarket, il y a carrément des achats en fait. Il va lancer des achats, tu vois, des ordres d'achats pour amplifier la simulation. C'est exceptionnel, ça. Tu vois, regarde, Sarah, elle a mis quoi ? Elle a mis 30$, Karim, il a mis 40$, Iris, elle a mis...
Ah non, Iris Capital, tu vois. ça c'est c'est qui lui ? On peut cliquer dessus ? Bam ! Ah non on voit que ce qu'il a fait, on ne voit pas son entité, on ne peut pas cliquer dessus et voir ?
On va essayer de le trouver, il est où lui ? Pour trouver le truc là, bon courage ! Iris, on va enlever ça, je ne vois pas du tout.
En fait, pourquoi pas faire un ctrl F en fait ? Je me prends la tête pour quoi là ? Elle est où Iris là ?
Alors, là regarde, hop, ici, en plus elle est en noir, hop, nickel ! Donc c'est qui ? Ok, c'est une société, d'accord, donc c'est une société qui a investi, donc il y a des entités physiques personnelles, des personnes, et des sociétés qui investissent, qui mettent des bails en fait sur PolyMarket.
D'accord, putain, ça va être compliqué, désolé pour ceux qui comprennent rien, il y en a qui vont rien comprendre, je ne fais même pas encore les liaisons de ce que c'est vraiment qualitatif le fait qu'il y ait PolyMarket, on va voir, donc Sophie Dubois, ils achètent, j'espère qu'il y a des ventes.
En fait, t'as l'impression d'avoir lancé une machine qui est tellement puissante qu'il y a très peu de personnes qui la comprennent et qui vont l'utiliser.
En fait, on est en pleine découverte je crois, mais là c'est beaucoup trop long, c'est pas possible.
Donc vous savez ce qu'on va faire, comme c'est une vidéo test et qu'on va pas se mentir, je vais faire une pause là sur le truc, ça fait même pas un événement, c'est pas possible, c'est trop long avec DeepSeek V4 Pro, en fait il résonne trop fort pour chacune des tâches et c'est pas possible, on va passer 72 heures là.
Donc je vais faire un premier rapport pour qu'on puisse tester comment ça fonctionne les rapports sur ce projet, pour voir est-ce que ça marche aussi, si on arrête la simulation à l'événement zéro aussi.
Donc pause, ah, request fail, erreur 400, ah, tiens, peut-être qu'il y a un truc qui se passe en même temps, et comment on fait, moi je vais arrêter là, ok, donc il m'empêche d'arrêter lui.
En fait tu veux bouffer mes tokens, c'est ça, alors attends, le premier pause, ah non, il a fait un erreur sur le premier, ok bah vas-y bouffe mes crédits, c'est bon, je peux rien n'y faire.
Bon c'est pas grave, je vais récupérer directement le code de ce modèle Quain là, 3, on va le lancer à celui-ci, parce qu'il est rapide en plus.
Direction Cloud Code, on va lui dire, modifie le modèle au routeur actuel par 2 points celui-ci, et ouvre, attends, et relance Flask dans mon navigateur, sinon il va pas faire le changement.
Ça va certainement écraser ce qu'on était en train de faire, mais tant pis, faut qu'on le stoppe là, j'ai l'impression que je perds le contrôle, il est en train de faire quelque chose dont je suis pas d'accord, il y a un bouton pause et je peux pas, t'sais, on dirait que Amitos sort d'ici là.
Bon qu'il va kill Flask, donc forcément normalement...
S'arrêter, je vais rafraîchir. Hop, qu'est-ce qu'il se passe quand on rafraîchit ?
Ah, là la pause elle fonctionne, ouais, c'est reparti.
Attends, si je clique sur rapport, là, il se passe quoi ?
Non, ouais, je pense qu'il vaut mieux qu'on le relance.
On va le relancer. Bon, il y a eu des bugs, là.
Mais c'est déjà quand même mieux que MiroFish, il y en a beaucoup moins.
On reprend 2.0, on récupère le prompt de la simulation complet, donc on vérifie si c'était bien pour la société, blablabla.
Solivar, voilà, l'évolution interne de SolivarSAS, ok.
Allez, nickel, on va pouvoir relancer.
Là, il va faire une analyse, mais je ne vais pas lui donner l'accord.
Je vais laisser mon prompt initial, en gros.
On lui donne le fichier Markdown dans la SEEDS.
Donc là, il est en train de préparer, on va dire, des scénarios depuis le document.
Mais non, tu ne prépares rien du tout.
On va lancer avant que tu prépares quoi que ce soit.
Donc là, on est parti sur un modèle plus rapide.
Ça va enchaîner beaucoup plus vite.
On connaît maintenant le dashboard. Ok, Starting Anthology.
Ah ouais, il est allé d'une vitesse.
En moins de 2 minutes, il a déjà produit tout ça.
Il a déjà terminé. Ouais, ça va vite.
Ouais, ça change.
Donc, est-ce qu'on prédit sur les 3 marchés ?
On va voir la différence de rapidité.
Tiens, ça fera un benchmark.
Alors, bien sûr, il y en a qui doivent se poser la question pourquoi il parle de Carrefour, pourquoi il parle de Ledger, etc. Parce que, regarde, en fait, si je tape Carrefour, il est mentionné Carrefour Tech en tant que, voilà, Doctolib Pro, Carrefour Tech.
Donc, c'est normal qu'ils soient dans le graph.
Et Ledger, c'est pareil.
Voilà, Datadog France et Ledger.
Donc voilà, comme ça, vous comprenez que ce qu'il y avait dans le graph, ça n'a pas aucune logique.
Ça fait partie des documentations en interne qu'on lui donne.
Allez, il a terminé les agents profils. Ok.
Il a terminé l'environnement de simulation.
On l'a vu, il a 33 agents au total.
Twitter Reddit Polymarket.
Ok, là, on est bon.
Il a terminé la configuration de raisonnement du LLM.
Et il a préparé l'orchestration, comme tout à l'heure, ainsi que l'activation par séquence.
Alors, ça a l'air d'être plus complet que tout à l'heure, là, les textes.
168 rounds.
Non, on ne va pas faire 168 rounds.
Tu es un malade mental.
On va en faire 40.
Donc, c'est parti, on va start.
C'est ce qu'il nous recommande.
Donc là, à mon avis, préparez-vous parce que ça va aller très, très vite.
Là, le graph, il va vite devenir colossal.
Attends, il a déjà fait 80 événements.
Ça fait deux minutes, là, même pas.
Il y a un problème, là.
J'ai tourné la tête, je suis revenu à tout ça.
Ça va trop vite.
Ok, total event.
Peut-être qu'il y avait un bug tout à l'heure.
Peut-être, en fait, DeepSeek V4...
Oh, il a rigidifié la solution, les raisonnements en fait, ça va peut-être casser des trucs en interne, faudra un peu creuser.
120 événements, c'est pas possible, il a pas fait 120 événements là, c'est pas possible.
Waouh, tout ce qui sort là, putain.
161. Ah, il y a eu une vente, regardez, ok.
Donc tout à l'heure il y a eu des achats, mais là on voit une vente.
Donc il y a Squad Epsilon qui a effectué une vente polymarket.
En fait, je ne contrôle rien à ce qui est en train de se passer, quand tu lances une simulation, tu ne contrôles rien.
C'est un peu ça qui est excitant et marrant, mais si on regarde les influences un peu...
Ok, Car4Tech a beaucoup d'influences sur cette simulation.
Karim aussi, Karim Ben Saïd, Elise Marshall.
Ok, les drifts.
Le drift, on a un pic là.
Au round 2, on a eu un pic.
Niveau network, alors qui a de l'influence ? Carrefour.
Karim aussi, Antoine Vasseur, il a de l'influence.
Niveau démographique, qu'est-ce qu'on a ?
On a 0 agents 18-24, tu vois, tout à l'heure on en avait un seul.
Ok, 45-54, on a un seul agent, bon on a des pics des 25-34.
Au niveau des marchés, qu'est-ce qu'on a ?
Ah ouais, carrément en fait, ah oui d'accord, ok, j'ai compris en fait.
Au niveau des marchés prédictifs, qu'est-ce qu'il se passe ?
Ça lance des prédictions de marché en fait.
Est-ce que Solvar...
Non mais attends, c'est un truc de malade là.
Ça c'est les what-ifs pour pouvoir choisir et puis lancer des recomputes.
On le testera plus tard.
Ok, et branch, ça on l'avait vu.
Ok influence.
Donc qu'est-ce qu'il se passe là ?
246 événements.
D'accord en fait, j'ai confondu événements et round.
Non, ce sont des événements, ok.
Parce qu'en fait sur Mirrorfish ici, total round en fait, on voit les rounds.
Du coup, c'est où qu'il y a écrit les rounds là ?
Ah regardez ici, R9.
Voilà Plaza.
Ok, dans les logs, on n'est qu'au round de 9.
On n'est qu'au début.
Bon bah écoutez, ça va tourner au café là.
Mais par contre, je tiens à le préciser pour la transparence de la vidéo.
Là, je suis vraiment content.
Parce qu'il n'y a aucun bug.
Il n'y a eu aucun bug de requête.
C'est OpenRouter-like.
Il doit y avoir directement dans le code, alors je n'ai pas vérifié dans le code.
Il fallait que j'aille regarder.
Mais un système de retry en cas d'erreur, en cas d'échec de requête sur OpenRouter.
Ouais, c'est trop bien ça.
Ah regardez, il y a des pavés de texte là.
RFC 2026.05 ne suffit pas.
J'ai analysé 14 déploiements critiques depuis janvier.
9 ont...
Ah oui, c'est quand même très précis là ce qui est en train de sortir.
C'est un commentaire sur Reddit.
Enfin du moins Reddit. Entrez-nous combien de fois le rate limiting a été désactivé en prod, ah oui il y a des questions de confrontation.
Squad Alpha, alors attends, ils sont où Squad Alpha là ?
Pour voir un petit peu comment ils ont été entraînés, Squad Alpha, ah il y a Beta là, elle est là Squad Alpha.
Ah putain revient, voilà Squad Alpha elle est là.
Alors, bien sûr c'est dans le segment Startup, il y a les agents d'action Reddit, Twitter, ok.
Ok l'entité elle n'a pas, oui logiquement, elle n'a pas d'émotion parce que c'est pas un humain, si je vais sur Sophie par exemple, est-ce qu'on voit son...
Non on ne voit pas son profil, ok. Bon laissons tourner, on n'est que aux 14.
Regardez juste la précision de ce message, de Léa Cohen.
Merci pour ce retour structuré et nécessaire, en tant que représentant de Solivar je tiens à réaffirmer notre engagement vers une transformation qui allie agilité client et excellence opérationnelle, nous entendons clairement les préoccupations critiques, nan nan nan.
Il y a de la factualité, account seal stack, une cohérence score, ouais, launch checklist, ouais.
Putain pour avoir ce dataset je peux te dire qu'il va falloir que tu en confrontes des gens.
Alors que là tu peux lancer une simulation.
Bon le graph il est pas si énorme que ça au final, par contre il y a beaucoup de relations, tu vois il y a énormément de relations qui sont effectuées.
Si je mets les labels bon ça ressemble un petit peu à ça pour l'instant.
Et Solivar qui est l'entité principale, tu vois c'est Solivar la maîtresse, c'est la société principale donc elle tient tout le monde.
Je le mentionne quand même pour le transcript mais au niveau de la vitesse c'est bien bien plus fluide.
Je m'en rappelle sur Mirrorfish c'était extrêmement lent, mon PC est ramé, pourtant c'est un M3 Pro.
J'ai envie de vous dire que là c'est hyper fluide quoi, le fait que ce soit en local, que ce soit plus rapide, moins cher, plus qualitatif, y'a pas de bug.
Mirrorfish à la poubelle.
Ça me fait penser à une fourmilière, vraiment, on dirait une fourmilière.
Regarde moi ça, t'arrives même plus à lire un truc.
Là il y a quand même eu 512 événements, il y en a eu 140 sur X, il y en a eu 282 sur Reddit et 90 sur Polymarket.
Donc on voit que Reddit a pris une posture plus importante et on voit que 512 événements pour uniquement 25 rounds c'est pas mal, pas mal du tout.
En plus de ça on peut toujours passer au rapport.
Bon on va attendre pour la fin, c'est pas très très long en somme.
De toute façon les logs vous regardez, là il est 10h35 lorsque c'est tourné, si je remonte j'ai commencé à 10h22, donc ça fait même pas 15 minutes et on est à plus de la moitié.
Et franchement avec DeepSeek V4 on aurait attendu 72 heures.
Ca on regarde l'influence, ok on voit que les influences majeures c'est Carrefour Tech, Romain Castel, ah Romain il est passé au-dessus de Karim là.
Au niveau du drift, bon c'est un peu plus stabilisé on va dire.
Le network, on voit, ah oui le network on voit Carrefour, Antoine Vasseur, ok.
Niveau démographique, bon ça ça n'a pas bougé hein, par contre ouais, les gens, bah ça ça n'a pas bougé, les pays, on est que en France.
Donc forcément je pense aux multinationales, c'est un outil de malade pour eux, je sais même pas s'ils utilisent ça en interne, je pense que oui, faut pouvoir faire de la projection.
Imaginons Carrefour, par exemple des Carrefour en France, des Carrefour, j'en sais rien, en Belgique, dans plusieurs pays, même au Maroc je crois et dans des pays du Maghreb il y a des Carrefour il me semble.
Pour pouvoir faire ça c'est pas mal, enfin c'est pas pas mal en fait, c'est nécessaire.
Regardez-moi ça, c'est une galaxie.
Et voilà il a terminé, donc c'est du vomi hyper structuré.
Total 678 événements, 197 sur X, 373 sur Reddit et 108 sur Polymarket.
Donc tous les événements sont ici, on peut les scroller, il y a eu un total de 0 erreurs dans les logs, j'ai vérifié, c'est terrifiant.
Et on n'a plus qu'à cliquer sur rapport pour faire un rapport.
Donc on découvre, on voit ce qu'il se passe.
Waiting for report agents, donc on va attendre le rapport.
Ok, donc là tu simules l'évolution interne, donc là il y a le requirement, l'alignement de démarrage qu'on avait mis.
Avec notre périmètre, tu vois recommandation post simulation à J plus 90, donc c'est le périmètre du CEO.
Donc là il fait quoi, il fait un retriving, tu vois il est en train de récupérer 81 nodes.
Il récupère les 510 edge, donc les 510 connexions qu'il a eues, les passerelles, les ponts entre les boules, comment ça s'appelle, c'est pas des boules.
Ce sont des nodes, voilà c'est des noeuds.
Et il va nous produire un rapport, nickel.
Ok, le rapport est arrivé, ça a pris, avec ce modèle là, ça a pris même pas 40 secondes.
Ok, c'est juste la base.
Donc là il va générer synthèse et implications, viabilité des scénarios et recommandations.
Ok, on a directement le process, putain c'est pas mal ça, regarde.
En fait, il a fait quoi, d'abord il a travaillé sur la résistance silencieuse des chapters leads.
Ok, bon après les termes, c'est pas du copywriting.
Là c'est de la rentabilité, c'est tout ce qui est ennuyeux mais rentable.
Ok, tout le result, donc là il fait des recherches.
Aïcha Driss supporte la création de TechAlignment.
Hugo Berger, il récupère les infos.
Putain, le nombre de connexions, c'est un truc de malade.
J'ai pas fait beaucoup de rounds, j'en ai fait que 40, ça m'a pris 20 minutes.
En interne, quand je vais le tester juste après cette vidéo pour le bombarder, c'est le cas de le dire, parce que je vais lancer le maximum de rounds possibles.
Si je peux en lancer 300, je lance 300.
Ok, donc regarde, en fait, c'est comme un article de blog.
Là, tu vois, il fait la partie 1, il l'a rédigé entièrement.
Ok, ensuite, partie 2, tu peux les déplier.
Sauf que là, en fait, il n'y a pas beaucoup de texte, mais...
Ah ouais, regarde, Elise Marshall, elle est CTO au bordel.
Elle dit qu'elle ne valide pas la roadmap plateforme si on touche à l'API Gateway.
Ça, c'est un développeur qui a dit ça, à tous les coups.
Comme si on pouvait aligner la texte sur les clients quand les gens portent les contrats.
Ça veut dire qu'il y a de la friction, de la contradiction.
C'est-à-dire que le dataset va être qualitatif.
Ils ne sont pas tous, on va dire, tous biaisés dans l'ultra-positivité.
Qui a vu les nouveaux canals Squad Text Deep Dive créés par Hugo, Pierre et Maya ce matin ?
Déjà 27 membres, ils disent que c'est juste pour partager des bonnes pratiques, mais on sait tous que c'est le retour des silos.
Ok, bon, là, ils commencent à se clasher, là.
Dans les logs, là, il vient de dire Running LLM Based Fallback, donc il y a un mécanisme de fallback, et on voit qu'il lance en parallèle.
Donc c'est pour ça que ça va quand même vite.
Regarde, conflit opérationnel et départ clé.
La cascade des démissions non annoncées.
Donc là, il a créé des fichiers Markdown, tu vois, section 3, tac, et fallback d'interview.
Donc il est en train de faire des interviews complètes de 8 agents en parallèle.
Panorama recherche, 521 validés, historique de 57.
Les logs sont de meilleure qualité que MiroFish.
Et voilà, il a terminé la 3 et la 4.
Ok nickel.
Donc maintenant, on a la structure, donc il a préparé les sections.
Donc planning outline, résistance silencieuse, récréation des silos, conflit opérationnel, synthèse et implication, viabilité des scénarios, etc. Et complète.
On peut l'exporter en JSON et en CSV.
Donc premier réflexe, Google Sheets, on va voir à quoi ça ressemble, ce qu'il nous a fait.
Après, en fait, avec ce dataset, on peut faire des trucs colossales.
Ah oui, ok, donc là, il nous a quand même fait combien de lignes ?
Ouais 679.
Alors c'est structuré comment ?
Déjà, il y a les plateformes, donc on peut trier par plateforme, par timestamp, c'est exact, par heure.
Les noms des agents, les types d'actions, qu'est-ce qu'ils ont fait ?
Les arguments d'action, donc en JSON, les résultats.
Alors les résultats, il n'y en a pas, c'est vide.
Peut-être que c'est en bas, non ? Je vais voir comme ça.
Ouais, c'est bizarre.
Et ici, c'est le succès.
Donc regarde, en fait.
C'est bien, on voit qu'il n'y a que des trous, et il n'y a pas eu un seul échec.
Donc le mécanisme de fallback est très très bon.
Et on n'a plus qu'à rentrer dans l'interaction Deep.
Donc ok, là on a le rapport, et là si on rentre en Deep Interaction, on va pouvoir parler en fait.
Et on va pouvoir parler avec quoi ? Avec toute la structure, la préparation qu'on a effectuée.
Donc on peut chatter avec l'agent de rapport, donc avec le rapport tout simplement, poser des questions, enrichir, ou choisir un chat.
Par exemple, imaginons qu'on veut parler avec Antoine.
C'est un exemple, mais regarde.
Qu'est-ce que tu as fait Antoine ?
Et on vient discuter directement.
Voilà, comme ça.
Bon là il y a un bug sur la réponse, je vais le laisser volontairement.
On va essayer de poser des questions ici.
Peux-tu me résumer ce rapport, qu'est-ce qu'il s'est passé dans les étapes clés ?
Je vais préparer une autre.
Donc là ça peut aussi varier suivant le modèle en fait.
Il y a certains modèles qui auront une fenêtre de contexte plus limitée.
Donc ils peuvent, on va dire, plus foirer leurs réponses que d'autres, ou la qualité ne sera pas la même.
Après là il le fait en anglais, donc je ne sais même pas si lui poser la question en français ça va être assez qualitatif.
Bon on va voir ce qu'il va dire.
Ok, voilà on a la réponse.
Il l'a fait en français.
Verdict échec de la restructuration.
Là on a, enfin, on sait que ce sera un échec et le score de confiance c'est 87%.
Étape clé dynamique, critique 0.90.
Ok.
Annonce de la restructuration.
1er juin, première crise, conflit d'ownership commercial.
C'est le premier signe de résistance organisé.
Émergence des ghost guilds.
On a les noms et les prénoms bien sûr.
Ça ressort les factualités à la CTE bordel.
Ouais.
Top 5 des dynamiques émergentes.
D'accord.
On va poser une question différente.
Quels ont été les points de friction qui auraient pu être abordés différemment dans un objectif d'éviter cet échec ?
On dit de restructuration.
Soyons clairs.
Donc là j'avais même pas vu mais regardez il y a un texte, un sous-texte en fait, regardez.
La restructuration a déclenché une décentralisation informelle du pouvoir vers des squads leads, autoproclamés et des ingénieurs influenceurs.
Tandis que les chapters leads officiellement maintenus deviennent des figures fantômes.
Un renversement de hiérarchie invisible mais décisif.
Alors qu'est-ce qu'il me dit là ?
Concernant ma question qui était très précise.
Verdict, l'échec était évitable.
Les points de friction étaient prévisibles et structurels pas humains.
Tu vois ça c'est bien quand même, c'est très précieux.
La restructuration a échoué non pas à cause de la résistance des équipes.
à cause du choix de conceptions organisationnelles brutaux, malveillants envers la complexité et aveugles au pouvoir réel.
Voici les 5 points de friction.
C'est incroyable.
Parmi tout ce dataset, c'est quand même énorme.
Bon, on ne va pas creuser plus que ça, je vais le faire en interne, on va le faire en interne pour certains membres, ceux qui sont les plus avancés on va dire, mais je peux vous assurer que là peut-être que vous ne vous rendez pas compte, mais vous allez tous tendre vers ça dans pas longtemps.
Parce que parler à un seul agent IA, c'est bien, une seule IA, mais là si tu regardes cette vidéo même, tu n'as pas trop compris, prends le transcript, dis-lui quel a été le process, quel a été le dataset et quelle est la qualité potentielle de réponse en comparaison avec uniquement un seul cloud, code ou un seul cloud 4.7 sur la web application.
Je pense que tu comprendras mieux.
Et on peut aussi poser des questions groupées.
Imagine qu'on veut isoler Antoine, Catherine et Inès, hop, je n'ai pas trop aimé comment vous vous êtes comportés, tout simplement, on va envoyer, là on va un peu les agresser là.
Allez, c'est parti, on envoie ça.
Alors bien sûr, un CEO qui a tous ses employés ou qui veut simuler carrément certains pôles, il peut les sélectionner, il peut leur poser des questions, ça peut même, c'est vraiment deep, deep, deep, c'est le cas de le dire, deep interaction.
Ok, donc là, ah regarde, ok, ils ont répondu, ça serait marrant.
Je comprends que mon approche puisse heurter, mais ce n'est pas une question de comportement.
Oula, tu parles mal au boss toi, fais gaffe, ça va te tomber dessus.
Par contre, il y a des factualités, il ressort complètement du coup l'historique, parce qu'ils ont accès à l'historique.
D'accord, Catherine, elle me répond exactement la même chose, elle est par mimétisme elle, et elle aussi, Inès.
Alors là les filles, il faut vous calmer, qu'est-ce qui vous arrive ? Alors est-ce que j'ai loupé un truc là, on ne peut pas télécharger en PDF ce truc ? Ce rapport, ça aurait été bien, de toute façon, ce n'est pas logique qu'on ne puisse pas le télécharger ça.
Bon, bien sûr, on a toujours accès au graphe, regarde, c'est un graphe avec tant de relations, donc une qualité, une densité d'informations qui est égale à une fourmilière.
Bon, je ne vais pas creuser plus que ça, il y a certainement des choses que j'ai dû manquer, mais tant mieux, et ça viendra par la suite.
Si ça t'a plu, n'hésite pas à liker, partager et t'abonner.
En tout cas, dis-toi un truc, c'est que c'est extrêmement puissant ça, le marché ne le comprend pas encore, mais sache-le, je suis en avance sur mon temps, ça, ça va rendre des gens beaucoup plus rentables que ce qu'ils imaginent.
Allez, on se dit à très vite pour une prochaine, c'était Mayday, ciao !
Loading video analysis...