Le podcast Java en Français

Les Cast Codeurs : le podcast en français de, par et pour les développeurs.

Prenez connaissance des dernières nouvelles de la sphère Java et du développement en général. Plongez sur un sujet précis avec les épisodes interview.

Supportez les radotages de vos hôtes : Emmanuel Bernard (Red Hat, Hibernate, Quarkus), Arnaud Héritier (Doctolib, Jenkins), Guillaume Laforge (Google, Groovy), Antonio Goncalves (Microsoft, auteur), Katia Aresti (Red Hat, Infinispan).

LCC 308 - Après c'est avant

Posté le 19/03/2024

Cet épisode discute du retour d’expérience Java de Netflix, de jQuery, de gouvernance open source, d’Elon Musk, de Kubernetes, de Mistral (gagnant ?), d’attaques des LLMs, de développement de carrière et de Trouble du Déficit de l’Attention avec ou sans Hyperactivité.

Enregistré le 15 mars 2024

Téléchargement de l’épisode LesCastCodeurs-Episode-308.mp3

News

Les Cast Codeurs veulent essayer quelque chose de nouveau et le sondage montre que vous aussi. On lance donc une section “Ask Me Anything” (AMA) ! Posez-nous une question sur https://lescastcodeurs.com/ama et nous prendrons certaines questions pour y répondre. Lancez-vous, on pense que cette section pourra être sympa :).

Langages

Retour d’expérience de Netflix sur ZGC https://netflixtechblog.com/bending-pause-times-to-your-will-with-generational-zgc-256629c9386b

  • Moins de tail latency ce qui veut dire moins de charge sur le système (moins de retries).
  • Aussi plus facile de trouver les vrais problèmes de latence (plus cachés dans les latences de GC).
  • Et sans consommation supérieure de CPU pour les mêmes perfs, malgré les barrières différentes de ZGC.
  • Pas de tuning explicite de leur part (enfin presque).
  • Même si les pointeurs ne sont pas compressés, l’efficacité du GC compense.

Librairies

Sortie de Spock 2.4-M2 https://spockframework.org/spock/docs/2.4-M2/release_notes.html

  • Support de plusieurs librairies de mocking.
  • Meilleur support dans les IDEs.
  • Et plein d’autres petites améliorations.

jQuery 4 est sorti ! jQuery est de retour ! https://www.infoq.com/news/2024/03/jquery-4-beta-release-note/

  • On parle régulièrement du dernier framework JavaScript à la mode, mais jQuery est toujours là.
  • Première release majeure depuis 8 ans.
  • Suppression de plein de features qui étaient dépréciées et maintenant souvent fournie par défaut par les moteurs JavaScript des navigateurs.
  • jQuery continue d’être téléchargé de plus en plus au fil du temps, mais peut-être parce qu’il bénéficie du succès des projets qui l’utilisent, tels que Cypress, WordPress ou Drupal.

Quarkus sort sa deuxième LTS https://quarkus.io/blog/quarkus-3-8-released/

  • Explique les changements importants depuis la LTS 3.2.

Infrastructure

Linkerd, ou plutôt la boîte derrière, va faire payer pour accéder aux builds stable du projet. Cela crée des conversations au sein de la CNCF https://www.techtarget.com/searchitoperations/news/366571035/Linkerd-paywall-prompts-online-debate-CNCF-TOC-review

  • Deploy envoy, c’est plus dur.
  • Buoyant est le principal contributeur derrière Linkerd.
  • Et ils ont décidé de mettre les distributions stables derrière un paywall.
  • Pour les sociétés de plus de 50 employés ($2000 par cluster).
  • Les gens se trouvent floués, car ils ont aidé au succès et ensuite se retrouvent piégés.
  • La licence reste ASL, mais la version stable est derrière un paywall, comme Red Hat Enterprise Linux récemment.
  • Un autre exemple de projet open source qui vire commercial.
  • Questionne la gouvernance open source, la CNCF va enquêter et peut-être durcir ses critères de graduation.
  • Weaveworks (FluxCD) a aussi fermé ces dernières semaines.

Cloudflare a réécrit un proxy HTTP en Rust https://blog.cloudflare.com/how-we-built-pingora-the-proxy-that-connects-cloudflare-to-the-internet/

  • Ils ont utilisé Nginx pendant longtemps.
  • Mais le single-worker model ne permettait pas certaines optimisations.
  • Et ils ont des besoins spécifiques.
  • Bref ils ont réécrit en Rust, multithreaded et avec work stealing.
  • Et ils sont contents.

Le guide du “hater” sur Kubernetes https://paulbutler.org/2024/the-haters-guide-to-kubernetes/

  • L’auteur se plaint régulièrement de Kubernetes pour sa grande complexité, mais reconnait que c’est quand même un grand morceau de technologie.
  • À utiliser surtout quand on a besoin:
    • d’exécuter plusieurs processus/serveurs/tâches planifiées,
    • de les exécuter de manière redondante et répartir la charge entre eux,
    • de les configurer, ainsi que les relations entre eux, sous forme de code.
  • L’auteur liste ensuite les fonctionnalités qu’il utilise, celles auxquelles il fait attention quand il les utilise, et celles qu’il préfère éviter :
    • Utilise : deployments, services, cron jobs, config maps et secrets.
    • Attention : stateful set, persistent volume et RBAC.
    • Évite : le YAML à la main, les opérateurs et resources customs, Helm, tout ce qui est mesh, les resources ingress, essayer de répliquer la stack K8S complète localement sur sa machine.

Data et Intelligence Artificielle

Mistral AI et Microsoft passent un accord sur le modèle le plus puissant de Mistral, et certains ne sont pas content https://www.latribune.fr/technos-medias/informatique/l-alliance-entre-mistral-et-micr[…]usion-de-l-independance-technologique-europeenne-991558.html

  • Mistral avançait son approche open source.
  • Mais son modèle le plus puissant ne l’est pas.
  • Ils ont un partenariat exclusif avec Microsoft pour le distribuer.
  • Et MS rentre dans le capital.
  • Au revoir l’indépendance de l’IA européenne.
  • Au revoir les grands modèles open source.
  • Cela va à l’encontre du lobby et de son positionnement auprès de la commission européenne.
  • Ça fait grincer des dents à Bruxelles, qui avait allégé les contraintes sur les modèles fondamentaux à la demande de Mistral qui menaçait de devoir s’allier avec Microsoft si ce n’était pas le cas.
  • Mistral était un fer de lance des modèles open sources pour éviter les biais.
  • Ils en garderont, mais pas les modèles specialisés ou optimisés.
  • Cela reste une bonne decision économique pour Mistral.

Infinispan 15 est sorti https://infinispan.org/blog/2024/03/13/infinispan-15

  • JDK 17.
  • Redis Hot Replacement donnant : multi-threads, clustering, réplication cross-site, diff stores de persistence en disk, avoir des caches différents en namespace différentes avec des règles appliquées à chaque cas d’usage.
  • Recherche Vectorielle et stockage des embeddings.
  • Integration avec Langchain (Python), Langchain4j, et Quarkus Langchain.
  • Améliorations du search, replication cross site, la console, tracing, l’opérateur Kubernetes…
  • Support du Protobuf 3 avec la release de Protostream 5 et meilleur API.

Outillage

Ne pas signer ses commits cryptographiquement ? https://blog.glyph.im/2024/01/unsigned-commits.html

  • L’article cite comme seul avantage d’avoir le petit badge vert sur Github indiquant “vérifié”.
  • Responsabilité future inconnue et potentiellement illimitée pour les conséquences de l’exécution du code dans un commit que vous avez signé.
  • Renforcement implicite de GitHub en tant qu’autorité de confiance centralisée dans le monde de l’open source.
  • Introduction de problèmes de fiabilité inconnus dans l’infrastructure qui repose sur les signatures de commit.
  • Une violation temporaire de vos identifiants GitHub entraîne désormais des conséquences potentiellement permanentes si quelqu’un parvient à y introduire une nouvelle clé de confiance.
  • Nouveau type de surcharge de processus continu : les clés de signature de commit deviennent une nouvelle infrastructure permanente à gérer, avec de nouvelles questions comme « que faire des clés expirées », « à quelle fréquence dois-je les renouveler », etc.
  • On peut empêcher de pousser des commits non signés.

Sécurité

Des modèles avec des backdoors uploadés sur hugging faces non détectés https://arstechnica.com/security/2024/03/hugging-face-the-github-of-ai-hosted-code-that-backdoored-user-devices/

  • Par les chercheurs de JFrog.
  • Une centaine ont été détectés, dont 10 malicieux.
  • Des tests de chercheurs, mais un faisant un reverse SSH.
  • S’appuie sur le format de serialisation pickle en Python. Populaire, mais reconnu comme dangereux.

Une première side attack channel sur les LLMs https://arstechnica.com/security/2024/03/hackers-can-read-private-ai-assistant-chats-even-though-theyre-encrypted/

  • Cela s’appuie sur la taille des packets chiffrés envoyés et leur timing pour détecter la longueur des tokens.
  • Ensuite un LLM spécialisé reconstruit la suite de mots la plus probable vu la longueur.
  • C’est dû à l’UX qui envoie les tokens au fil de l’eau.
  • C’est facilement corrigeable en rendant les paquets de taille fixe et en ajoutant du hasard de délai d’envoi…
  • Mais c’est rigolo comment les LLMs peuvent amplifier les side-channel attacks.

Architecture

Netflix et Java https://www.infoq.com/presentations/netflix-java/

  • Netflix est un java shop.
  • La “stack Netflix” connue du public a beaucoup évolué.
  • Pleins de microservices.
  • Gen1 : Groovy en gateway frontend for backend, RxJava et Hystrix.
  • Gen2 : GraphQL et GraphQL fédéré ; plus de réactif dans la gateway.
  • Java 17 : 2800 apps java.
  • Utilisent Azul JDK.
  • Avaient du Java 8 sur du Guice et des app custom.
  • Utilisent G1, Java 17 = -20% CPU et Shenandoah pour la gateway Zuul.
  • Plans pour Java 21 (ZGC, virtual threads).
  • Après spéculatif.
  • Ils ont standardisé sur Spring Boot il n’y a pas si longtemps.

Un long article sur les microservices https://mcorbin.fr/posts/2024-02-12-microservice/

  • Encore un me direz vous !
  • Oui, mais si vous êtes en pleine crise existentielle avec votre équipe, c’est du bon matériel.
  • Il va sur les points importants comme synchrone vs asynchrone, les patterns de communication, la copie de données, comment tester le “monolithe” ou plutôt comment ne pas le faire…
  • C’est un peu long mais, ça recadre bien.

Méthodologies

Opinion: est-ce qu’on peut devenir dev à partir de 40 ans https://www.codemotion.com/magazine/dev-life/can-you-become-a-programmer-after-40/?utm_source=ActiveCampaign&utm_medium=email&utm_content=5+Frontend+Trends+we+Didn+t+See+Coming+in+2024&utm_campaign=NL_EN_240215+%28Copy%29&vgo_ee=sFCRn4bbw8NuvJwlxj4PgXiVS4eICnA1ZPdkH4DGKyhNNwh6NQ%3D%3D%3Au3g96%2Fz3Uf7kZHAF7tezy9Y0ZJ6paAsE

  • Programmeur de CSS à 40 ans, je sais pas 😜
  • L’auteur regrette les pubs pour devenir dev à 40 ans facilement.
  • Développeur, c’est beaucoup de connaissance et de travail et ce doit être un choix éclairé, pas un choix pas default ou facile.
  • Il décrit certains biais comme un 20 ans sans expérience est plus pardonné qu’à 40, le temps à y consacrer est différent…
  • Compensé par des actes de motivation (GitHub, participation open source, meetups…).
  • Mais le temps d’apprendre de ses erreurs n’a pas vraiment de court-circuit.
  • Bref, une formation, c’est bien mais pas suffisant.

Navigate your own way https://www.infoq.com/presentations/lessons-opportunities-carrier/

  • IBMer for 21 years. I’m a Java champion.
  • Réfléchir à sa carrière en mode time box, chercher sa promotion ? Tu peux décider ton chemin.
  • Momentum pandémie ça lui a fait beaucoup réfléchir sur sa vie et où elle était. Moment où elle quittait IBM pour aller vers RH (cœur se brise).
  • Essentiels pour prendre ton propre chemin.
  • Se connaître soit-même, reconnaître les différences avec les autres.
  • Connaître tes valeurs : qu’est-ce qui est important pour toi, qu’est-ce qui te motive ou te démotive. Écrire des mots.
  • Se fixer des objectifs avec l’aide des autres.
  • Repousser ses limites sur des sujets dont tu penses que ce n’est pas possible pour toi.
  • Participe activement, entoure-toi bien.
  • Un talk très personnel et inspirant.

Un article sur le trouble TDAH chez le développeur adulte https://rlemaitre.com/fr/posts/2023/11/hacker-le-tdah-strat%C3%A9gies-pour-le-d%C3%A9veloppeur-moderne/

  • Diagnostiqué à 44 ans.
  • Schéma d’inattention et d’hyperactivité/impulsivité qui interfère avec le fonctionnement.
  • Affecte le fonctionnement social scolaire ou professionnel.
  • Non diagnostiqué : burn out, anxiété ou depression.
  • Souvent non diagnostiqué jusqu’à ce que ses propres enfants soient diagnostiqués.
  • Mais cela amène du positif : hyperfocus, résolution créative de problèmes, adaptation rapide aux changements qui sont du pain béni.
  • Le négatif, c’est la gestion du temps, l’organisation, l’instabilité.
  • Discute ensuite les phénomènes dans le cerveau.
  • Et donne des techniques et des pièges à éviter.
  • Vous avez sûrement des collègues TDAH ou, l’êtes-vous vous-même.

Conférences

La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 307 - Interview sur la passion, la créativité et le fun sur le long terme avec Holly Cummins et Mark Jane

Posté le 04/03/2024

Enregistré le 27 février 2024

Téléchargement de l’épisode LesCastCodeurs-Episode-307.mp3

Interview

Les Cast Codeurs accueillent deux invités spéciaux pour explorer un aspect crucial de la carrière informatique : comment conserver la passion, la créativité et le plaisir au fil du temps.

Holly Cummins et Mark Jane

Holly Cummins
Mark Jane

Holly Cummins est dans l’open-source depuis 20 ans. Elle est Java Champion et JavaOne Rock Star. Elle a co-écrit le livre ‘Enterprise OSGi in Action’ chez Manning et a présenté des conférences dans divers événements renommés tels que JavaOne, Devoxx, et JAX London. Elle travaille chez Red Hat en 2024, et contribue principalement sur Quarkus.

Mark Jane, est un acteur accompli et improvisateur chevronné depuis 1994. Il rejoint la troupe Eux en 2016, jouant dans le spectacle Bio à Paris, et Pilote et Chaos en 2024. Il a écrit le livre “Jeux et enjeux: La boîte à outils de l’improvisation théatrale”.

Les deux naviguent leur carrière avec passion, créativité et fun depuis +20 ans.

Dans ce podcast, Holly et Mark partagent leurs conseils et expériences uniques, découvrant de nombreux points communs malgré l’apparente disparité entre leurs deux professions.

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 306 - Alors tu squash ou tu pointes?

Posté le 13/02/2024

Dans cet épisode, Katia, Emmanuel et Arnaud explorent de nouvelles approches du Builder pattern en Java, l’introduction du Pattern Matching des Primitives en Java, et les déboires de l’intelligence artificielle avec des attaques de la chaîne d’approvisionnement sur Pytorch. Ils abordent aussi les licenciements dans diverses entreprises technologiques, l’évolution du trafic de Stackoverflow et donnent de conseils pratiques pour les développeurs, notamment sur les commits conventionnels, la mise à jour de dépendances avec Dependabot, Renovate et le débogage des programmes Java. Ils terminent avec leur retour d’expérience sur la relecture des sujets de Devoxx France 2024.

Enregistré le 9 février 2024

Téléchargement de l’épisode LesCastCodeurs-Episode-306.mp3

Votre avis compte énormément pour nous ! 🎧 Nous voulons rendre Les Cast Codeurs encore plus genial, et c’est là que vous intervenez. 🌟 Aidez-nous en partageant vos idées, suggestions et souhaits pour 2024, dans notre tout nouveau formulaire de retour. C’est rapide, facile et ça ne prend que 2 minutes.

News

Langages

Une approche différente du Builder pattern en Java, inspirée par ce qui se fait dans la communauté Golang https://glaforge.dev/posts/2024/01/16/java-functional-builder-approach/

  • Les builders, surtout quand ils sont imbriqués les uns dans les autres, peuvent devenir un peu verbeux à lire.
  • Est-ce qu’on peut prendre une nouvelle approche ? Oui, en tirant parti des lambdas, avec des méthodes de mutation qui retournent des lambda qui effectuent la mutation.
  • On retrouve le plaisir de pouvoir construire une instance à l’aide d’un constructeur, plutôt qu’un builder.
  • En recherchant le sujet, Guillaume est aussi tombé sur une approche type safe du builder classique https://www.endoflineblog.com/type-safe-builder-pattern-in-java-and-the-jilt-library (qui est implémentée sous forme d’annotation processor dans le petit projet open source Jilt).

Pattern Matching Primitives (JEP 455) https://openjdk.org/jeps/455

  • Uniformité autorisant le pattern de type pour tous les types, qu’ils soient primitifs ou de référence et sécurité dans la conversion de types et éviter les erreurs runtime pour les conversions de type. Plus de robustesse.
  • Ça l’explique bien ici. Les deux https://www.infoq.com/news/2024/02/java-enhances-pattern-matching/.
  • Exemple :
    • Avant
      if (i >= -128 && i <= 127) {
          byte b = (byte)i;
          ... b ...
      }
      
    • Maintenant
      if (i instanceof byte b) {
          ... b ...
      }
      byte b = 42;
      b instanceof int;         // true (unconditionally exact)
      int i = 42;
      i instanceof byte;        // true (exact)
      int i = 1000;
      i instanceof byte;        // false (not exact)
      

News Java, le tour https://www.infoq.com/news/2024/02/java-news-roundup-jan29-2024/

  • Open JDK avec preview de Classe File API,
  • JDK 22 et 23,
  • Glassfish, GraalVM, Spring, Quarkus, Infinispan, Hibernate, Grails, Vert.x… plein d’outils,
  • Keycloak,
  • Langchain,
  • Lire les détails dans l’article d’InfoQ.

Data et Intelligence Artificielle

Une attaque de supply chain sur Pytorch et l’IA https://johnstawinski.com/2024/01/11/playing-with-fire-how-we-executed-a-critical-supply-chain-attack-on-pytorch/

  • Soumettre une PR avec une correction de typo.
  • Ça leur a permis de faire tourner la CI automatiquement quand ils poussent la PR.
  • Soumis une PR qui curl fetch un gist qui tournait sur un runner auto-hébergé.
  • Et ils ont choppé les tokens pour plus tard publier les binaires dans les repos officiels.
  • Et personne n’a rien vu.

Support du modèle de génération d’image Imagen dans LangChain4j rajouté dans la dernière version du project https://glaforge.dev/posts/2024/02/01/image-generation-with-imagen-and-langchain4j/

  • Contribué par Guillaume.
  • On peut générer des images, mais aussi les éditer.

Collab entre Google et Hugging Face https://www.infoq.com/news/2024/01/hugging-face-gcp-ai/

  • Intégration avec Vertex.ai et d’autres services Google.
  • Facilite le deploy dans le cloud Google et l’intégration avec Kubernetes.

Guillaume a écrit un article et développé une application pour visualiser les tokens générés par les Large Language Models dérivés du modèle PaLM https://glaforge.dev/posts/2024/02/05/visualize-palm-based-llm-tokens/

Outillage

Stackoverflow voit son traffic diminuer doucement depuis quelques années, mais depuis l’avènement de ChatGPT et consort, la chute s’accélère https://twitter.com/swyx/status/1753122780709871834

Amélie Benoit - Dependabot Visual way https://twitter.com/AmelieBenoit33/status/1754397434812203455

Méthodologies

Le pouvoir des “conventional commits” par Julien Ponge https://julien.ponge.org/blog/the-power-of-conventional-commits/

  • Convention poussée par l’équipe Angular, à la base.
  • Pour standardiser et clarifier les messages de commits.
  • Mais aussi pratique pour les outils comme JReleaser pour automatiser les release notes d’un projet.

Loi, société et organisation

Google vire encore des ingénieurs dans la division matérielle pixel, et dans les ingénieurs cœur https://www.nytimes.com/2024/01/11/technology/google-layoffs.html

Okta vire 400 personnes dont Matt Raible https://techcrunch.com/2024/02/01/okta-layoffs-400-employees/

  • Cela suit Microsoft (gaming), eBay, SAP, RIOT Games (League of Legends), Google, Amazon (Prime, Audible), Unity et plein d’autres.
  • Tout ça juste en janvier.

Facebook fête ses 20 ans https://www.francetvinfo.fr/internet/reseaux-sociaux/facebook/facebook-a-20-ans-de-sit[…]la-lente-mutation-du-doyen-des-reseaux-sociaux_6323610.html https://www.bbc.com/news/technology-68109208

  • Quoi dire de plus, le temps passe vite… #old

Rubrique débutant

Manuel de survie de la femme dans la tech https://www.duchess-france.fr/dossier/women%20in%20tech/alli%C3%A9s/2023/01/15/manuel-survie-femme-tech.html

Java Thread Dump - VisualVM, jstack, kill -3, jcmd https://www.digitalocean.com/community/tutorials/java-thread-dump-visualvm-jstack-kill-3-jcmd

  • Parfois vos programmes Java ont l’air bloqués.
  • Vous pouvez effectuer un thread dump dans un autre terminal en récupérant le PID du process Java et en faisant un kill -3 PID.

Conférences

Dans les coulisses du Call for Paper de Devoxx France 2024.

La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 305 - Dia critique

Posté le 15/01/2024

Cet épisode news discute de langages, de bibliothèques, d’intelligence artificielle bien sûr et même de Web. Et puis de challenge Java et même de Père Noël !

Enregistré le 12 janvier 2024

Téléchargement de l’épisode LesCastCodeurs-Episode-305.mp3

News

RIP Niklaus Wirth https://en.wikipedia.org/wiki/Niklaus_Wirth

  • Informaticien Suisse
  • Conception des langages ALGOL, Modula-2 et… Pascal
  • Plusieurs distinctions: Turing 1984, John Von Neumann 1994. Depuis 1987 un prix créé à son honneur
  • Plusieurs livres dont Algorithms + Data Structures = Programs 1976
  • La Loi de Wirth: La beauté d’un programme réside dans la clarté de sa structure. Niklaus Wirth a toujours prôné la simplicité, la lisibilité et la compréhensibilité. Approche pragmatique

https://recording.zencastr.com/lescastcodeurs/news-305

Langages

L’enfer sur terre: equals and hashCode pour les entitées JPA. Tout le monde a un avis, faire le sien est compliqué

Kotlin va t’il décliné en 2025, faute d’innovation et avec les nouvelles features de Java ? https://shiftmag.dev/kotlin-vs-java-2392/

  • Selon l’auteur, d’autres langages alternatifs pour la JVM ont décliné, comme Groovy et Scala
  • L’auteur pense qu’il y aura de moins en moins de différenciants par rapport à Java, et Kotlin n’a pas rajouté de fonctionnalités significatives depuis un an ou deux

Comment enlever des accents et autres marques diacritiques dans des chaines de caractères en Java https://glaforge.dev/posts/2024/01/url-slug-or-how-to-remove-accents-in-java/

  • Pour les URLs d’un blog post, par exemple, on souhaite avoir le titre dans l’URL, mais de manière URL-friendly, donc sans accents, en remplaçant les espaces par des tirets, etc
  • Guillaume propose une approche basée sur la normalisation de chaine unicode et les expressions régulières
  • Mais il évoque également la librairie Slugify qui est en plus capable de faire de la translitération (pour transformer aussi des idéogrammes et autre caractères non-ASCII)

Les “gatherers” de JDK 22 https://blog.soebes.io/posts/2024/01/2024-01-07-jdk-gatherer/

  • Nous avons mentionné récemment le JEP 461 pour Java 22 : Stream Gatherers, qui sera en preview
  • Permet de faire des choses qui étaient un peu compliquées à faire avec l’API stream avant, comme par exemple implémenter des fenêtres glissantes sur les données du stream
  • L’article parle des différentes capacités des gatherers, avec un Integrator, un Initializer et un Finisher, et enfin un Combiner, avec différents exemples de code pour les illustrer

Librairies

Le fonds tech souverain d’origine allemande sponsorise le développement de Log4J https://www.sovereigntechfund.de/news/log4j-investment

  • 3 contributeurs pourront bosser dessus à temps plein
  • permet de sécuriser le développement du projet
  • réaction à l’impact de la CVE Log4shell qui avait bien marqué les esprits et fait bosser plein de gens le weekend pour tout patcher !

Cloud

Le glossaire de la Cloud Native Foundation a été traduit en Français https://glossary.cncf.io/fr/

Web

Sortie de Vue.JS 3.4 https://blog.vuejs.org/posts/vue-3-4

  • le parseur de composants (SFC) est 2x plus rapide
  • amélioration du système de réactivité en particulier pour les propriétés “computed” (recalculées)
  • le namespace JSX deprecated a été supprimé
  • Cédric Exbrayat de NinjaSquad couvre également les nouveautés dans cet article https://blog.ninja-squad.com/2023/12/29/what-is-new-vue-3.4/

Astro JS 4.1 https://astro.build/blog/astro-410/

  • Découverte de ce FW grâce à Petipois https://medium.com/front-end-weekly/create-a-website-using-astro-in-2024-f5963003c19c
  • Astro est le framework web pour la construction de sites web axés sur le contenu tels que les blogs, le marketing et le commerce électronique. Astro est surtout connu pour être le pionnier d’une nouvelle architecture frontend afin de réduire la surcharge et la complexité de JavaScript par rapport aux autres frameworks
  • Architecture en “Astrot Islands” (interface en composants isolés)
  • SSG et SSR (Static Site Generator ey Server Side Rendering)
  • 0 Javascript si tu veux
  • Tu utilises React, Angular ou Vue pour tes composants
  • Lis plus ici : https://kinsta.com/fr/blog/astro-js/

React à 10 ans… et là ma découverte de React Server Components https://www.joshwcomeau.com/react/server-components/#introduction-to-react-server-components-3

  • “At a high level, React Server Components is the name for a brand-new paradigm. In this new world, we can create components that run exclusively on the server.”
  • L’idée est de n’est pas faire des composants entiers en react dans le backend, et de n’est pas déléguer aux rendering client pour ces composants

Prédictions 2024 https://thenewstack.io/2024-predictions-by-javascript-frontend-framework-maintainers/

  • Angular: Optional Zone.JS
  • Next.js (nouveau compilateur, + backend ?)
  • React: adoption de React Server Components, SPA ne suffit pas. React auto-memorizing (useCallback/useMemo deprecate)
  • Solid 2.0 viendra après SolidStart (framework web)

Data et Intelligence Artificielle

Retour d’experience sur faire du RAG avec des LLMs https://x.com/taranjeetio/status/1742587923189596531?s=20

Gunnar Morling a lancé le 1 billion row challenge : https://www.morling.dev/blog/one-billion-row-challenge/

  • L’idée est de calculer le min / max, la moyenne, de températures, indiquées ligne par ligne dans un énorme fichier
  • Il y a énormément de contributions. Les plus rapides ont utilisé des memory mapped files, ou bien des instructions SIMD
  • Le challenge était en pur Java, mais d’autres personnes ont tenté l’expérience avec diverses bases de données ou autres langages de programmation

Didier Girard parle de Shadow AI https://www.linkedin.com/posts/didiergirard_shadowai-genai-gouvernance-activity-7150031627006464000-IF1G/

  • Comme on a parlé de “shadow IT” à une époque, la nouvelle ombre du jour, c’est l’intelligence artificielle
  • Pour être plus productifs, les employés utilisent l’IA, sans forcément le dire à leur employeur
  • Le problème étant qu’avec certains système d’IA, les données que vous envoyées peuvent être sauvegardées et utilisées pour ré-entrainer l’IA… et potentiellement, l’IA pourrait recracher verbatim du texte provenant de ces données à d’autres utilisateurs. D’où une brèche dans la sécurité des données de l’entreprise

Appel de fonction avec le LLM Gemini de Google https://glaforge.dev/posts/2023/12/22/gemini-function-calling/

  • Les Large Language Model sont limités par les connaissances qu’ils ont acquises lors de leur entrainement
  • Une approche possible pour se baser sur une base documentaire est d’utiliser l’approche Retrieval Augmented Generation (RAG) où l’on utilise une base de données vectorielle pour récupérer des passages de texte qui correspondent à la requête demandée
  • Mais il existe aussi une approche intéressante qui permet d’appeler des systèmes externes (APIs, service local, etc) en permettant au LLM de savoir qu’il peut répondre à une demande donnée en se basant sur l’appel d’une fonction. Dans cette approche, le LLM répond qu’il faudrait appeler une fonction (par exemple pour connaitre la météo à Paris) et il indique quels paramètres passer (“Paris”). Le développeur ensuite appel cette fonction et retourne le résultat de l’invocation au LLM, qui va ensuite pouvoir générer du texte avec ces données.
  • C’est l’approche “function calling” qui permet d’étendre à un LLM pour lui donner accès à des données live, derrière une API, etc

Méthodologies

Une video sur le père Noël et la pensé critique de la Tronce en Biais https://youtu.be/tqlYKO_asFw?si=g1Fq5OfCvQONNb2i

  • Vidéo interessante pour comprendre comment nous, dans la tech, on peut tomber facilement sur des croyances qui sont doutantes si on développe pas l’esprit critique.
  • Le père Noël, véritable complot planétaire des adultes, magasins, médias … d’un mensonge
  • Un enfant qui essaie d’appliquer le procédé épistémologique, il n’a pas d’autre source pour vérifier que le père noël n’existe pas, tous ses sources fiables duquel il apprend le monde (parents, profs, medias, histoires, medias) valident que le père noël existe.
  • Expliquer les incoherences par la magie, c’est quelque chose de complément banal dans l’univers d’un enfant à qui on parle en permanence de magie
  • La découverte de la mensonge aux alentours de 7 ans, l’age de la raison, est une bonne opportunité pour aborder l’esprit critique avec les enfants

Loi, société et organisation

EU AI Act cheat sheet https://www.linkedin.com/posts/yann-lecun_eu-ai-act-cheat-sheet-understand-activity-7139980837013331971-TDqI?utm_source=share&utm_medium=member_ios

  • Les entreprises vont avoir 1 ou 2 ans pour s’y conformer
  • Basics: Definition de l’AI, extraterritorialité, exceptions (oss, r&D, mais aussi défense …), classification par niveaux de risks (Prohibited > High Risk > Limited Risk > Minimal Risk)
  • Prohibited: Biometrique, social credit scoring, detection d’emotions, renforcement des lois basées sur l’identification biometrique en public
  • High (des régles sont définies pour controler ces usages: transparence, qualité, risque …): Le matériel médical, les véhicules, l’éducation, les élections, …
  • General: Transparence et information

ChatGPT n’est pas un super médecin https://x.com/drhughharvey/status/1736308984288563550?s=46&t=C18cckWlfukmsB_Fx0FfxQ

  • ces d’utilisation ChatGPT en copilote
  • Trop de non déterminisme dans les réponses à la même question
  • 41% des réponses dans le consensus médical
  • 7% dangereuse
  • Faire du rag n’a monté que de quelques pourcents 5

Transcription de la conférence donnée PGConf EU par Laetitia Avrot et Karen Jex (expertes Postgresql): Trying to be Barbie in Ken’s Mojo Dojo Casa House https://karenjex.blogspot.com/2023/12/trying-to-be-barbie-in-kens-mojo-dojo.html

  • Il s’agit d’une conférence en sociologie. En sociologie, il suffit que quelque chose soit vrai pour la majorité des cas pour être considéré comme une vérité, car cela repose sur des statistiques.
  • Sujet donné pour susciter de l’attention sur un problème qui existe bien dans la tech. Elles ont réalisé que la grande majorité de la population n’en était pas consciente (barbie)! Le film Barbie les a fait comprendre qu’elles doivent expliquer ce à quoi les femmes sont confrontées au quotidien, afin que les autres puissent comprendre à quel point cela peut être épuisant.
  • Très bien documenté avec bcp de liens et références au delà de l’expérience personnelle
  • Transcription et slides dans l’article
  • Lien entre film Barbie et la place des femmes dans la tech. Idées non neuves mais cela a été un impact
  • Les biais en général ne sont pas particuliers à un genre, sont globales. Test sur les biais implicites
  • Il existe un déficit de talents technologiques (estimé atteindre de 1,4 million à 3,9 millions de personnes d’ici 2027 dans les pays de l’UE-27), qui pourrait potentiellement être comblé en doublant la proportion de femmes dans le secteur technologique. Cependant, la part des femmes dans les rôles technologiques connaît sa plus basse représentation dans les domaines en pleine croissance tels que DevOps et le cloud.
  • plus de la moitié des femmes quittent l’industrie technologique 10 à 20 ans après le début de leur carrière, soit le double du taux des hommes. (manque d’opportunités, difficultés face aux biais, se sentir comme une outsider etc…)
  • La part des femmes dans les rôles technologiques en Europe risque de diminuer pour atteindre 21% d’ici 2027.
  • Solutions: roles modèles, combattre nos biais (si on ne les reconnait pas, on ne peut pas le combattre), mentoring, faire attention à donner de la voix etc…

New York Times porte plainte à open ai https://www.bbc.com/news/technology-67826601

  • réclame des billions en copy right, suit aussi Microsoft et Bing qui utilise open ai
  • on peut trouver des extraits des articles avec suscription disponibles
  • Si on demande à chat gpt sur des news actuelles, reprend des explications tirés du NYT sans le mentionner
  • Sur bing on peut trouver aussi des extraits sans citer ni linker la source
  • Conséquences pour NYT: moins d’accès à leur site, moins de consultations, moins des clicks, chute des suscriptions, pertes monétaires importantes
  • Réponse de OpenAI au NYT https://openai.com/blog/openai-and-journalism
    • We collaborate with news organizations and are creating new opportunities
    • Training is fair use, but we provide an opt-out because it’s the right thing to do
    • “Regurgitation” is a rare bug that we are working to drive to zero
    • The New York Times is not telling the full story

Outils de l’épisode

Userscripts https://github.com/quoid/userscripts: extension pour changer le CSS et JS des sites dans votre navigateur

Rubrique débutant

Guillaume a publié 2 “codelabs” pour démarrer sur LangChain4J, en utilisant le LLM PaLM de Google https://glaforge.dev/posts/2023/12/18/get-hands-on-codelabs-to-dabble-with-llms/

  • Ces 2 tutoriels pratiques permettent de découvrir les deux modèles text et chat de PaLM
  • Différentes tâches sont illustrées pour faire de simples questions/réponses, de simples chat, mais aussi comment extraire des données structurées d’un texte, comment faire de la classification (avec un exemple d’analyse de sentiment)

Google Summer of Code - appel aux projets https://summerofcode.withgoogle.com/

Conférences

La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 304 - Dark punk

Posté le 18/12/2023

Dans cet épisode, Katia, Arnaud et Emmanuel discutent les nouvelles de cette fin 2023. Le gatherer dans les stream Java, les exceptions, JavaScript dans la JVM, recherche vectorielle, coût du cloud, Gemini, Llama et autres animaux fantastiques et pleins d’outils sympathiques pour fêter la fin de l’année.

Enregistré le 15 décembre 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-304.mp3

News

Aide Les Cast Codeurs et remplis un petit formulaire pour nous guider l’année prochaine https://lescastcodeurs.com/sondage

Langages

Avec JEP 461, arrivée dans en preview en Java 22 de la notion de gatherer pour les streams https://groovy.apache.org/blog/groovy-gatherers

  • Dans cet article de Paul King, de l’équipe Groovy, il montre et contraste avec ce que l’on pouvait faire en Groovy depuis des années, comme des sliding windows par exemple.
  • Explique l’approche des gatherers avec ses opérations intermédiaires.
  • Les gatherers sont des operations intermédiaires spécifiques qui prennent un état et le prochain élément pour décider quoi faire, et même changer le stream d’éléments suivants (via la fonction integrate).
  • Certains peuvent permettre de combiner les résultats intermédiaires (pour paralléliser).
  • Exemples : fenêtres de taille fixe, fenêtres glissantes.

Joe Duffy, qui est CEO de Pulumi mais qui avait travaillé chez Microsoft sur le project Midori (un futur OS repensé), parle du design des exceptions, des erreurs et des codes de retour https://joeduffyblog.com/2016/02/07/the-error-model/

  • Il compare les codes d’erreurs, les exceptions, checked et non-checked.
  • Il sépare les bugs des erreurs attendues (les bugs doivent arrêter le process).
  • Il raconte l’histoire des unchecked exceptions et de leurs problèmes, des checked exceptions, et pourquoi les développeurs Java les détestent (selon lui).
  • Long article, mais intéressant dans ses retours.
  • Mais long, je ne suis pas allé au bout 😊.

Après la disparition de Nashorn dans le JDK, on peut se tourner vers le projet Javet https://www.caoccao.com/Javet/index.html

  • Javet permet d’intégrer JavaScript avec le moteur V8.
  • Mais aussi carrément Node.js.
  • C’est super comme capacité, car on a les deux meilleurs moteurs.
  • Par contre, le support hors x86 est plus limité (genre ARM sous windows c’est non).

Librairies

Une partie de l’équipe Spring se fait lourder après le rachat effectif de Broadcom https://x.com/odrotbohm/status/1729231722498425092?s=20

  • Peu d’info en vrai, à part ce tweet.
  • Mais l’acquisition Broadcom n’a pas l’air de se faire dans le monde des Bisounours.

Marc Wrobel annonce la sortie de jbanking 4.2.0 https://www.marcwrobel.fr/sortie-de-jbanking-4-2-0

  • Support de Java 21.
  • Possibilité de générer aléatoirement des BIC.
  • Amélioration de la génération aléatoire d’IBAN.
  • jbanking est une bibliothèque pour manipuler des structures typiques des banques, comme les IBAN, les BIC…

Hibernate Search 7 est sorti https://in.relation.to/2023/12/05/hibernate-search-7-0-0-Final/

  • Support ElasticSearch 8.10-11 et openSearch 2.10-11.
  • Rebasé sur Lucene 9.8.
  • Support sur Amazon OpenSearch Serverless (experimental).
  • Attention, sous-ensemble de fonctionnalités sur Serverless, c’est un API-first search cluster vendu à la Lambda.
  • En lien aussi sur la version 7.1.Alpha1.

Hibernate ORM 6.4 est sorti https://in.relation.to/2023/11/23/orm-640-final/

  • Support pour SoftDelete (colonne marquant la suppression).
  • Support pour les operations vectorielles (support PostgreSQL initialement).
  • Les fonctions vectorielles sont particulièrement utilisées par l’IA/ML.
  • Événements spécifiques JFR.

Intégration de citrus et Quarkus pour les tests d’intégrations de pleins de protocoles et formats de message https://quarkus.io/blog/testing-quarkus-with-citrus/

  • Permet de tester les entrées / sorties attendues de systèmes de messages (HTTP, Kafka, serveur mail…).
  • Top pour tester les applications Event-driven.
  • Pas de rapport, mais Quarkus 3.7 ciblera Java 17 (~8% des gens utilisaient Java 11 dans les builds qui ont activé les notifications).

Hibernate Search 7.1 (dev 7.1.0.Alpha1) avec la dernière version de Lucene (9.8), Infinispan rajoute le support pour la recherche vectorielle.

Cloud

Comment choisir sa région cloud https://blog.scottlogic.com/2023/11/23/conscientious-cloud-pick-your-cloud-region-deliberately.html

  • Pas si simple.
  • Critères :
    • le coût,
    • la sécurité légale de vos données,
    • la consommation carbone de la région choisie (la France est top, la Pologne moins),
    • la latence vs où sont vos clients,
    • les services supportés.

Web

Vers une standardisation des Webhooks ? https://www.standardwebhooks.com/

  • Des gens de Zapier, Twilio, Ngrok, Kong, Supabase et autres, se rejoignent pour essayer de standardiser l’approche des Webhooks.
  • La spec est open source (Apache) sur Github.
  • Les objectifs sont la sécurité, la fiabilité, l’interopérabilité, la simplicité et la compatibilité (ascendante / descendante).
  • Sans la spec, chaque webhook est different dans son comportement et donc les clients doivent s’adapter dans la sémantique, les erreurs…
  • La (meta-) structure de la payload, la taille, la sécurisation via signature (p. ex. HMAC), les erreurs (via des erreurs HTTP)…

Data et Intelligence Artificielle

Google annonce Gemini, son nouveau Large Language Model https://blog.google/technology/ai/google-gemini-ai/

Avec la sortie de Gemini, Guillaume a écrit sur comment appeler Gemini en Java https://glaforge.dev/posts/2023/12/13/get-started-with-gemini-in-java/

  • Gemini est multimodèle, donc on peut passer aussi bien du texte que des images, ou même de la vidéo.
  • Il y a un SDK en Java pour interagir avec l’API de Gemini.

Facebook, Purple Llama https://ai.meta.com/blog/purple-llama-open-trust-safety-generative-ai/

  • Opensource https://ai.meta.com/llama/.
  • Dans l’optique des modèles GenAI ouverts, Facebook fournit des outils pour faire des IA responsables (mais pas coupables 😉).
  • Notamment des benchmarks pour évaluer la sureté et un classifier de sureté, par exemple pour ne pas générer du code malicieux (ou le rendre plus dur).
  • Llama purple sera un projet parapluie.
  • D’ailleurs Meta, IBM, Red Hat et pleins d’autres ont annoncé l’AI Alliance pour une IA ouverte et collaborative entre académique et industriels. Sont notamment absent Google, OpenAI (pas ouvert) et Microsoft.
  • Juste une annonce pour l’instant, mais on va voir ce que ces acteurs de l’AI Alliance feront de concret.
  • Il y a aussi un Responsible Use Guide (pas lu).

Apple aussi se met aux librairies de Machine Learning https://ml-explore.github.io/mlx/build/html/index.html

  • MLX est une librairie Python qui s’inspire fortement de NumPy, PyTorch, Jax et ArrayFire.
  • Surtout, c’est développé spécifiquement pour les Macs, pour tirer au maximum parti des processeurs Apple Silicon.
  • Dans un des repos Github, on trouve également des exemples qui font tourner nativement sur macOS les modèles de Llama, de Mistral et d’autres (https://github.com/ml-explore/mlx-examples).
  • Non seulement les Apple Silicon, mais aussi la mémoire unifiée CPU/GPU qui est une des raisons clés de la rapidité des Macs.

Faire tourner Java dans un notebook Jupyter https://www.javaadvent.com/2023/12/jupyter-notebooks-and-java.html

  • Max Andersen explore l’utilisation de Java dans les notebooks Jupyter, au lieu du classique Python.
  • Il y a des kernels Java selon vos besoins.
  • Mais il faut les installer dans la distro jupyter qu’on utilise.
  • Et c’est la que jbang, installable via pip, vient à la rescousse.
  • Il installe automatiquement ces kernels en quelques lignes.

Outillage

Sfeir liste des jeux orientés développeurs https://www.sfeir.dev/tendances/notre-selection-de-jeux-de-programmation/

  • Parfait pour Noël.
  • Mais c’est pour ceux qui veulent continuer à challenger leur cerveau après le boulot.
  • Jeu de logique, jeu de puzzle avec le code comme forme, jeu autour du machine learning, jeu de programmation assembleur.

Les calendriers de l’Avent sont populaires pour les développeurs ! En particulier avec Advent of Code https://adventofcode.com/

Un super thread de Clara Dealberto sur le thème de la “dataviz” (data visualization) https://twitter.com/claradealberto/status/1729447130228457514

  • Beaucoup d’outil librement accéssibles sont mentionnés pour faire toutes sortes de visualisations (ex. treemap, dendros, sankey…) mais aussi pour la cartographie.
  • Quelques ressources de site qui conseillent sur l’utilisation du bon type de visualisation en fonction du problème et des données que l’on a.
  • Notamment celui du Financial Times qui tient dans une page de PDF.
  • Bref c’est cool, mais c’est long à lire.

Une petite liste d’outils sympas

Docker acquiert Testcontainers https://techcrunch.com/2023/12/11/docker-acquires-atomicjar-a-testing-startup-that-raised-25m-in-january/

Architecture

Comment implémenter la reconnaissance de chansons, comme Shazam https://www.cameronmacleod.com/blog/how-does-shazam-work

Méthodologies

Un mémo de chez ThoughtWorks à propos du coding assisté par IA https://martinfowler.com/articles/exploring-gen-ai.html#memo-08

  • Avec toute une liste de questions à se poser dans l’utilisation d’un outil tel que Copilot.
  • Il faut bien réaliser que malheureusement une IA n’a pas raison à 100% dans ses réponses, et même plutôt que la moitié du temps, donc il faut bien mettre à jour ses attentes par rapport à cela, car ce n’est pas magique.
  • La conclusion est intéressante aussi, en suggérant que grosso modo dans 40 à 60% des situations, tu peux arriver à 40 à 80% de la solution. Est-ce que c’est à partir de ce niveau-là qu’on peut vraiment gagner du temps et faire confiance à l’IA ?
  • Ne perdez pas trop de temps non plus à essayer de convaincre l’IA de faire ce que vous voulez qu’elle fasse. Si vous n’y arrivez pas, c’est sans doute parce que l’IA n’y arrivera même pas elle-même ! Donc au-delà de 10 minutes, allez lire la doc, chercher sur Google…
  • Notamment, faire générer les tests par l’IA dans la foulée augmente les risques surtout si on n’est pas capable de bien relire le code.
  • Si on introduit un choix de pattern genre flexbox en CSS, si c’est sur une question de sécurité, vérifier (ceinture et bretelle).
  • Est-ce le framework de la semaine dernière ? L’info ne sera pas dans le LLM (sans RAG).

Quelles capacités sont nécessaires pour déployer un projet AI/ML https://blog.scottlogic.com/2023/11/22/capabilities-to-deploy-ai-in-your-organisation.html

  • C’est le MLOps et il y a quelques modèles end to end (Google, IBM).
  • Mais vu la diversité des organisations, il est difficile d’embrasser ces versions complètes.
  • MLOps est un métier, data science est un métier, donc intégrer ces compètences.
  • Sachez gérer votre catalogue de données.
  • Construire un process pour tester vos modèles en continu.
  • La notion de culture de la recherche et sa gestion (comme un portefeuille financier, accepter d’arrêter des expèriences etc).
  • La culture de la recherche est peu présente en ingénierie, qui est plus de construire des choses qui fonctionnent.
  • C’est un monde pré-LLM.

Vous connaissez les 10 dark patterns de l’UX ? Pour vous inciter à cliquer ici ou là, pour vous faire rester sur le site, et plus encore https://dodonut.com/blog/10-dark-patterns-in-ux-design/

  • Parmi les dark patterns couverts
    • Confirmshaming,
    • Fake Urgency and the Fear of Missing Out,
    • Nagging,
    • Sneaking,
    • Disguised Ads,
    • Intentional Misdirection,
    • The Roach Motel Pattern,
    • Preselection,
    • Friend Spam,
    • Negative Option Billing or Forced Continuity.
  • L’article conclut avec quelques pistes sur comment éviter ces dark patterns en regardant les bons patterns de la concurrence, en testant les interactions UX, et en applicant beaucoup de bon sens !
  • les dark patterns ne sont pas des accidents, ils s’appuient sur la psychologie et sont mis en place spécifiquement.

Comment choisir de belles couleurs pour la visualisation de données ? https://blog.datawrapper.de/beautifulcolors/

  • Plutôt que de penser en RGB, il vaut mieux se positionner dans le mode Hue Saturation Brightness.
  • Plein d’exemples montrant comment améliorer certains choix de couleurs.
  • Il vaut mieux éviter les couleurs trop pures ou les couleurs trop brillantes et saturées.
  • Avoir un bon contraste.
  • Penser aussi aux daltoniens !
  • J’ai personnellement eu toujours du mal avec saturation vs brightness.
  • Faire que les couleurs en noir et blanc soient séparées avant de le remettre (en changeant la brightness de chaque couleur), ça aide les daltoniens.
  • Éviter les couleurs aux 4 coins, mais plutôt des couleurs complémentaires (proches).
  • Rouge, orange et jaune (non saturé) et variations de bleu sont pas mal.
  • Les couleurs saturées sont agressives et stressent les gens.

Pourquoi vous devriez devenir Engineering Manager ? https://charity.wtf/2023/12/15/why-should-you-or-anyone-become-an-engineering-manager/

  • L’article parle de l’évolution de la perception de l’engineering management, qui n’est plus désormais le choix de carrière par défaut pour les ingénieurs ambitieux.
  • Il met en évidence les défis auxquels les engineering managers sont confrontés, y compris les attentes croissantes en matière d’empathie, de soutien et de compétences techniques, ainsi que l’impact de la pandémie de COVID-19 sur l’attrait des postes de management.
  • L’importance des bons engineering managers est soulignée, car ils sont considérés comme des multiplicateurs de force pour les équipes, contribuant de manière significative à la productivité, à la qualité et au succès global dans les environnements organisationnels complexes.
  • L’article fournit des raisons pour lesquelles quelqu’un pourrait envisager de devenir Engineering Manager, y compris acquérir une meilleure compréhension de la façon dont les entreprises fonctionnent, contribuer au mentorat et influencer les changements positifs dans la dynamique des équipes et les pratiques de l’industrie.
  • Une perspective est présentée, suggérant que devenir Engineering manager peut conduire à la croissance personnelle et à l’amélioration des compétences de vie, telles que l’autorégulation, la conscience de soi, la compréhension des autres, l’établissement de limites, la sensibilité à la dynamique du pouvoir et la maîtrise des conversations difficiles. L’article encourage à considérer la gestion comme une occasion de développer et de porter ces compétences pour la vie.

Sécurité

LogoFAIL une faille du bootloader de beaucoup de machines https://arstechnica.com/security/2023/12/just-about-every-windows-and-linux-device-vulnerable-to-new-logofail-firmware-attack/

  • En gros en changeant les images qu’on voit au boot.
  • Permet d’exécuter du code arbitraire au tout début de la sécurisation de l’UEFI (le boot le plus utilisé).
  • Donc c’est game over parce que ça démarre avant l’OS.
  • Ce n’est pas une exploitation à distance, il faut être sur la machine avec des droits assez deja élevés, mais ça peut être la fin de la chaine d’attaque.
  • Et, comme d’habitude, un interpréteur d’images est la cause de ces vulnérabilités.

Conférences

L’IA au secours de conférences tech : rajoute des profils tech femme comme speaker au programme pour passer le test diversité online via des profils fake. https://twitter.com/GergelyOrosz/status/1728177708608450705 https://www.theregister.com/2023/11/28/devternity_conference_fake_speakers/ https://www.developpez.com/actu/351260/La-conference-DevTernity-sur-la-technologie-s-effondre-apres-que-l-organisateur-a-admis-avoir-cree-de-fausses-oratrices-generees-automatiquement/

  • J’avais lu le tweet du créateur de cette conf qui expliquait que c’était des comptes de tests et que, pris dans le rush, ils avaient oublié de les enlever.
  • Mais en fait les comptes de tests ont des profils “Actifs” sur les réseaux sociaux apparemment, donc c’était savamment orchestré.
  • Au final beaucoup de speakers et de sponsors se désengagent.

La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 303 - Interview sur Vert.x 4.5 avec Julien Viet

Posté le 04/12/2023

Ce qui a commencé comme un crowdcast a fini en interview de Julien Viet sur Vert.x 4.5.

Enregistré le 23 novembre 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-303.mp3

Interview

Ta vie ton oeuvre (présentation de l’interviewé)

Le site de Julien Viet
X (ancien twitter)

Vert.x 4.5

Vert.X 4.5 est sorti https://vertx.io/blog/whats-new-in-vert-x-4-5/

  • support des thread virtuels qui permet d’écrire le code synchrone pour des cas complexes et utiliser les thread locaux dans ces cas la. Cela ne remplacement pas le code de process des événements
  • le code put faire des future await qui ne bloqueront pas le thread principal
  • connection SQL dynamique: quand le host change dynamiquement dans l’application
  • support des proxies de niveau 7 pour les clients SQL
  • rotation certificats a chaud
  • des builders (HTTP, SQL connection)
  • extensions pour utiliser les coroutines kotlin

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 302 - Amour, Gloire et OpenAI

Posté le 27/11/2023

Dans cet épisode, Emmanuel, Guillaume et Katia abordent les nouveautés Java, le lancement du langage Misty par Douglas Crockford, l’arrivée de WasmGC dans Chrome, la sortie de Spring Framework 6.1, des évolutions dans les bibliothèques comme Vert.x 4.5, et des conseils sur la création de langages de programmation. L’épisode couvre également des actualités dans les domaines de l’infrastructure avec le premier ordinateur cloud commercial par Oxide, des annonces sur les frameworks web comme Angular v17, des réflexions sur les architectures monolithiques versus microservices, et sans oublier le soap Opéra du moins de novembre avec OpenAI en vedette.

Enregistré le 23 novembre 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-302.mp3

News

Langages

Recap Javaiste https://www.infoq.com/news/2023/10/java-news-roundup-oct09-2023

  • La JEP 454 sur l’appel à la mémoire et les API dites natives passera en target pour JDK 22, avec une façon d’ajouter les appels de méthodes restreintes sans le flag --enable-native-access (via un manifeste dans le JAR).
  • JDK 22 prévu pour mars 2024.
  • Spring Framework 6.1 est sorti.
  • Tomcat a quelques CVE, donc mettez à jour !

Douglas Crockford, le papa de JSON, sort un nouveau langage dénommé Misty https://www.crockford.com/misty/

  • Utilise des caractères unicodes pour définir des chaînes de caractères avec des chevrons, ou pour les opérateurs de base (comparison, and/or).
  • Support de la programmation concurrente avec les actors.

WasmGC arrive dans Chrome, par l’intermédiaire de v8 https://v8.dev/blog/wasm-gc-porting

  • Historiquement, il fallait compiler le port du langage lui-même (et donc son GC).
  • Maintenant, on peut compiler le code (Java) dans des primitives Wasm et WasmGC.
  • Java python et co ont des VM qui sont compilées pour toutes les architectures cibles (ARM, x86 etc), y compris le JIT, AOT.
  • Donc, on peut définir comme backend WASM lui-même, c’est l’approche classique.
  • WasmGC définit des structs et des array avec des champs dans lesquels on peut créer des instances, lire/écrire les champs, caster dans d’autres types et ces objets sont gérés par WasmGC lui-même.
  • On a un système de type du coup et des relations entre ces types.
  • Donc on représenterait les objets Java en objets Wasm.
  • Avantage et inconvenient des deux approches.
  • Tous les codes de management d’objets ne sont plus nécessaires (y compris malloc) ⇒ gain memoire.
  • En mode GC dans le langage, les liens objets du langage ↔ objets Wasm sont inefficaces, car les liens langage → Wasm définissent l’instance entière Wasm, donc des gros cycles d’objets ne sont pas GCed.
  • Wasm sandbox empêche d’inspecter la stack et d’éliminer des objets plus efficacement, et il n’y a pas d’API pour aider donc seul WasmGC peut utiliser cet avantage.
  • Un seul GC a des avantages : meilleure gestion de la pression mémoire.
  • Mais on réutilise le GC du Web (genre V8) vs celui de Java. (c’est moins un problème pour les autres langages avec des GC moins sophistiqués).
  • La fragmentation mémoire est plus proéminente quand on a des modules de type C qui peuvent garder des gros blocs mémoire “quasi-vides” (opaque). C’est managé plus finement en WasmGC.
  • Sémantiques de langage est plus dur à achever vu qu’on map en concepts WasmGC, il y a de la transformation.
  • Sémantiques des chaînes de caractères, nombres, etc peuvent être un peu ajustés.
  • Un port utilisant WasmGC n’est pas une réécriture de tout, mais un gros morceau de la VM du langage cible est à réécrire.
  • WasmGC peut optimiser comme les patterns en JVM, mais en WasmMVP c’est la toolchain avant qui fait le travail d’optimisation (p. ex. LLVM).
  • Donc avec WasmGC, la toolchain fera les optimisations de langage et WasmGC fera les optimisations low-level (inlining, constant propagation, dead code elimination).
  • Puis d’autres optimisations spécifiques à WasmGC comme les escape analysis.
  • Et ils parlent d’optimisations dans V8 pour approcher les appels dynamiques à la Java (pas défini à la compilation).

Écrire un langage de programmation… ça prend du temps… beaucoup de temps https://yorickpeterse.com/articles/a-decade-of-developing-a-programming-language/

  • Évitez le gradual typing.
  • Évitez le boostrapping de votre compilateur.
  • Évitez d’écrire votre propre générateur de code, linker, etc.
  • Évitez de tergiverser trop longtemps sur la syntaxe.
  • La prise en charge multiplateforme est un défi.
  • Les livres sur les compilateurs ne valent pas l’argent que vous dépenserez dessus.
  • Faire grandir et évoluer un langage de programmation est difficile.
  • La meilleure suite de tests est une application réelle.
  • Ne privilégiez pas les performances sur les fonctionnalités.

Librairies

Spring Boot rajoute le hot reload des certificats SSL pour embedded Netty et Tomcat https://spring.io/blog/2023/11/07/ssl-hot-reload-in-spring-boot-3-2-0

  • Utilisez reload-on-update: true.
  • Et écoute les changements de fichiers.
  • Pas mal dans les déploiements non-immuables (pas comme Kubernetes).

VertX 4.5 est sorti https://vertx.io/blog/whats-new-in-vert-x-4-5/

  • Support des threads virtuels qui permet d’écrire le code synchrone pour des cas complexes et utiliser les threads locaux dans ces cas-là. Cela ne remplace pas le code de process des événements.
  • Le code peut faire des future / await qui ne bloqueront pas le thread principal.
  • Connection SQL dynamique : quand le host change dynamiquement dans l’application.
  • Support des proxies de niveau 7 pour les clients SQL.
  • Rotation des certificats à chaud.
  • Des builders (HTTP, SQL connection).
  • Extensions pour utiliser les coroutines Kotlin.

Integration déclarative de Langchain4j dans Quarkus https://quarkus.io/blog/quarkus-meets-langchain4j/

Infrastructure

Oxide sort le premier ordinateur cloud disponible commercialement https://oxide.computer/blog/the-cloud-computer

  • Pas facile de séparer le buzz de la réalité.
  • On dirait un ordi purpose built avec l’efficience et le côté compact en tête.
  • Ils poussent contre le mode location uniquement des cloud providers.
  • En gros inspiré des cloud providers qui construisent leurs propres ordis (et même CPUs maintenant !).
  • Construit le hardware et le software en co-optimisation.
  • C’est un rack entier, peu de bruit de ventilateur.
  • Pas de cable (seul E/S du rack).
  • Donc ils ont leurs propres switch.
  • Compliqué de différencier l’avantage du désavantage.

Les leçons tirées de 20 de Site Reliability Engineering par Google https://sre.google/resources/practices-and-processes/twenty-years-of-sre-lessons-learned/

  • Le risque d’une mitigation doit être proportionné à la gravité de la panne.
  • Les mécanismes de récupération doivent être entièrement testés avant une urgence.
  • Canarisez tous les changements.
  • Avoir un “gros bouton rouge”.
  • Les tests unitaires ne suffisent pas, des tests d’intégration sont également nécessaires.
  • CANAUX DE COMMUNICATION ! ET CANAUX DE SECOURS !! ET DES SAUVEGARDES POUR CES CANAUX DE SECOURS !!!
  • Modes de dégradation intentionnel des performances.
  • Tester la résilience aux catastrophes.
  • Automatisez vos mitigations.
  • Réduisez le temps entre les déploiements, afin de diminuer la probabilité que le déploiement tourne mal.
  • Une seule version matérielle globale est un point de défaillance unique.

Karpenter une évolution d’Autoscaler pour les clusters Kubernetes https://blog.ippon.fr/2023/11/07/mettez-a-lechelle-vos-clusters-kubernetes-de-maniere-efficace-et-faites-des-economies-avec-karpenter/

  • Fonctionne uniquement pour AWS aujourd’hui, donc à voir la portabilité.
  • Permet d’ajouter ou de supprimer des nœuds au cluster Kubernetes en dynamique pour rightsizer ses clusters.
  • Bypass les API kube pour la creation d’instance et utilise les APIs AWS EC2 directement.
  • Permet des nœuds hétérogènes (pas homogène comme Autoscaler).
  • Et se rightsize rapidement (p. ex. 30s pour éteindre un nœud).
  • Besoin d’applis cloud-natives, car elles vont être baladées.

Web

Deno ! https://www.infoq.com/news/2023/10/deno-jupyter-integration

  • Dev experience, jupyter notebook integration.
  • Améliorations sur Visual Studio Code extension (compatible avec NodeJS).
  • L’exécution native sur Jupyter de Javascript et Typescript permet d’effectuer des analyses de données, construire des modèles d’apprentissage automatique et générer des rapports interactifs avec Deno.
  • Visualisations dynamiques avec D3 dans le notebook.
  • Connection à Deno KV.
  • Plusieurs améliorations sur le testing, APIs etc

Lancement du nouveau site angular.dev et de la version v17 du framework https://blog.angular.io/announcing-angular-dev-1e1205fa3039

Outillage

Il est possible de signer et notariser des applications pour macOS sur des machines non-Apple https://gregoryszorc.com/blog/2022/08/08/achieving-a-completely-open-source-implementation-of-apple-code-signing-and-notarization/

  • Implémenté en Rust.
  • Pratique pour les pipelines CI/CD basés sur Linux.
  • À priori, il y a des outils similaires pour le monde Windows, qui permet de signer sur une machine non-Windows : https://github.com/mtrojnar/osslsigncode.

Lors de son Github Universe, Copilot fait le show ! https://github.blog/2023-11-08-universe-2023-copilot-transforms-github-into-the-ai-powered-developer-platform/

  • Copilot Chat sera GA en décembre, il utilise GPT4, il permet de guider le développeur, de générer du code, de détecter des erreurs et aide à les corriger, d’expliquer le code.
  • Intégration à venir de Copilot Chat dans les IDEs de JetBrains.
  • Copilot Chat va être intégré sur github.com et dans l’appli mobile aussi.
  • Introduction de GitHub Copilot Enterprise pour les sociétés, qui permettra de spécialiser le modèle sur le code de l’entreprise.
  • Intégration de Copilot ans Workspace, donc quand on voudra adresser un bug, créer un pull request, Copilot pourra nous aider étape par étape, suggérer un plan d’action.
  • Copilot Enterprise permettra de faire des recherches avec le contexte entier du code de l’entreprise, donc idéalement meilleur que le focus sur un repo de Copilot.

Un guide sur OpenRewrite https://feeds.feedblitz.com/~/819402521/0/baeldung~A-Guide-to-OpenRewrite

  • Permet de refactorer le code via des règles.
  • Mise à jour des dépendances, enlever l’utilisation d’API dépréciées, migration d’une bibliothèque à une autre, etc.
  • Migration Java, migration framework, transformations spécifiques à votre société.
  • OpenRewrite vient avec un écosystème de recettes.
  • Intégration via Maven ou Gradle.
  • La suite montre des exemples de migrations.

Architecture

Article intéressant sur Monolithe vs Microservices ! https://www.infoq.com/articles/monolith-versus-microservices/

  • Le débat monolithe vs microservices. Les monolithes reviennent, par exemple Spring Modulith.
  • Les microservices sont la solution à la complexité plutôt que la cause de celle-ci. Toutes les applications deviendront complexes ; au-delà d’un certain point, les microservices nous aideront à gérer cette complexité.
  • Les microservices comportent des coûts et des avantages. Si les avantages ne l’emportent pas sur les coûts, vous n’aurez pas une expérience positive avec les microservices.
  • Nous pouvons arrêter notre transition vers les microservices quelque part au milieu du spectre, ce que j’aime appeler le modèle hybride. À ce stade, nous pouvons avoir quelques gros services mélangés à quelques petits services. Nous pouvons avoir le meilleur des deux mondes : la simplicité et la commodité du monolithe combinées à la flexibilité et à la scalabilité des microservices.
  • Il n’y a pas de choix binaire entre monolithique et microservices. En réalité, il existe un spectre de possibilités entre les deux. Si vous vous êtes fixé à l’une des extrémités du spectre, vous passez à côté de la grande variété d’architectures intermédiaires.
  • Nous devrions cesser de parler de monolithe contre microservices et plutôt avoir un débat plus nuancé sur la taille appropriée des services.
  • Les microservices mettent sur le devant de la scene la complexification du système, les monolithes le cachent sous le tapis.
  • Les microservices permettent de gérer cette complexité.
  • Automatisation est la clé dans l’adoption des microservices.
  • Bien aligner son architecture et son domain ou alors la douleur arrive.

Sécurité

Une explication de la CVE sur HTTP/2 https://quarkus.io/blog/cve-2023-44487/

  • En fonction de l’implémentation, le risque est plus ou moins grand (de plus de CPU à un full DDOS).
  • Au cœur du problème est la capacité d’envoyer pleins de requêtes en parallèle sur le meme pipeline HTTP/2.
  • Les serveurs ont en général une limite aux streams en parallèle (genre 100).
  • La CVE est exploitée côté client en ouvrant et fermant rapidement un stream, c’est plus léger sur le client, le serveur a un délai dans son processing.
  • Ce qui permet de bypasser la limite et affamer les resources du serveur.
  • C’est catastrophique en cas de one thread per request (thread starvation).
  • En event loop, c’est une queue plus grande (donc le cas de quarkus).
  • Pour mitiger, quarkus regarde le nombre de stream close requests par seconde pour détecter les abus (200 requêtes de fermeture sur une fenêtre de 30s).

Data / IA

Elon Musk annonce son LLM, appelé Grok https://x.ai/

  • Connectivité en temps réel avec Twitter !
  • Fenêtre de contexte de 25k characters.
  • Le LLM garderait le contexte de la conversation (au lieu d’avoir à toujours renvoyer toute la discussion dans le contexte, à cause du côté sans état des LLMs habituellement).
  • Le style, la personnalité, du LLM, serait assez humoristique, voire carrément sarcastique, à la Musk… et déjà sur Twitter une personne commentait en disant que c’était le LLM “anti-woke”.
  • Grok serait disponible pour les utilisateurs payants de Twitter.

OpenAI fait 4 nouvelles annonces https://openai.com/blog/new-models-and-developer-products-announced-at-devday

  • GPT-4 Turbo : leur dernier et plus puissant LLM. Il offre un contexte de 128k tokens, des prix plus bas et des quotas plus élevés. 128k c’est comme Claude.
  • Assistants API : une solution permettant de créer des mini-assistants personnalisés et de les exposer via une API. L’objectif est de faciliter l’intégration des solutions GenAI dans les applications, avec des fonctionnalités de gestion des conversations, d’interprétation de code et de RAG.
  • API pour DALL•E 3 : un modèle de 3e génération pour la génération d’images.
  • GPTs : des versions personnalisées de ChatGPT, faciles à développer même sans compétences en programmation. Une place de marché sera disponible pour monétiser ces “GPTs”.
  • Merci Didier et son X de résumer.
  • Un article plus complet de SFEIR.
  • Protection juridique en cas d’attaque de droits d’auteur.

Loi, société et organisation

Les acteurs et l’IA, deal pour arrêter la grève https://www.bbc.com/news/entertainment-arts-67364587

  • Les acteurs et les grands studios d’Hollywood ont conclu un accord le 8 novembre pour mettre fin à une grève qui a paralysé la production de films et de séries aux États-Unis pendant plusieurs mois.
  • L’accord prévoit une nouvelle convention collective de trois ans pour les acteurs (hormis les vedettes, les acteurs n’arrivent pas à gagner leur vie avec le streaming).
  • Revalorisation importante des salaires minimums ainsi que des garde-fous contre l’IA. Un système de primes pour les rediffusions en streaming.
  • Double mouvement social historique : les acteurs sont entrés en grève mi-juillet, les scénaristes depuis début mai. La paralysie du secteur a coûté au moins 6 milliards de dollars.
  • Les acteurs craignaient que les studios utilisent l’IA pour cloner leur voix et leur image, les réutiliser à perpétuité, sans compensation ni consentement. Les conditions entourant les droits des studios sur l’image des acteurs stars après leur mort a été négocié.

Chute de WeWork, dépôt de bilan https://www.maddyness.com/2023/11/06/wework-impact-coworking-france/

  • La disparition annoncée du géant mondial du coworking marque un tournant pour le secteur, y compris en France.
  • Asphyxié par une dette de près de 3 milliards de dollars.
  • Chute interminable entamée en 2019.
  • WeWork était le leader mondial du secteur et un pionnier du coworking.
  • WeWork propose 15 établissements en France, tous situés à Paris.
  • Pourtant, la demande pour le coworking ne cesse d’exploser.
  • Startups domicilient leur siège (Qonto par exemple) dans un espace de co-working.
  • Le modèle du coworking n’est pas remis en cause. WeWork, c’est un phénomène à part. Il y a eu une mauvaise gestion de départ d’une licorne qui croît à toute vitesse, en ne faisant absolument pas attention à son modèle économique de base (dit Clément Alteresco, CEO de Morning).
  • Mauvaise publicité pour le marché et les concurrents, qui considèrent qu’ils vont s’en sortir.

Les Français, les utilisateurs twitter le plus violents d’Europe? https://www.huffingtonpost.fr/france/article/les-francais-sont-les-utilisateurs-de-twitter-les-plus-violents-d-europe_225331.html

  • Les signalements de contenus, suppressions et suspensions pour propos violents et haineux au sein de X sont les plus nombreux en France, loin devant l’Allemagne et l’Espagne.
  • 16.288 suppressions de messages contre 7.160 en Allemagne et 7.743 en Espagne.
  • X explique avoir une « équipe internationale et inter-fonctionnelle » de « modérateurs humains », qui travaillent « 24 heures sur 24 avec la capacité de couvrir plusieurs langues ».

Sam Altman PDG d’OpenAI est débarqué par son conseil de surveillance https://thealgorithmicbridge.substack.com/p/why-openai-fired-sam-altman-and-what

Les groupes “Responsible AI” chez Google, Microsoft et plus récemment Meta sont détruits https://www.theverge.com/2023/11/18/23966980/meta-disbanded-responsible-ai-team-artificial-intelligence

  • Même débat chez OpenAI en fait.
  • Difficile de comprendre les raisons, à part que la course s’est accélérée.
  • L’article cite les gouvernements qui veulent réguler, mais je ne comprends pas en quoi cela influence.

Conférences

Retrouvez les conférences sur le site Developers Conferences Agenda/List par Aurélie Vache.

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 301 - Minoritaire ou majoritaire, là est la question!

Posté le 23/10/2023

Dans cet épisode, Emmanuel et Guillaume reviennent sur les nouveautés de l’écosystème Java (Java 21, SDKman, Temurin, JBang, Quarkus, LangChain4J…) mais aussi sur des sujets plus généraux comme Unicode, WebAssembly, les bases de données vectorielles, et bien d’autres sujets orientés IA (LLM, ChatGPT, Anthropic…).

Enregistré le 20 octobre 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-301.mp3

News

Langages

Gérer facilement de multiples versions de Java grâce à SDKMan! https://foojay.io/today/easily-manage-different-java-versions-on-your-machine-with-sdkman/

  • SDKMan! supporte Java, mais aussi GraalVM, JBang, Quarkus, Micronaut… (les CLIs).
  • La CLI UI est toujours un peu chelou, donc cet article est utile pour un rappel.

Tous les changements de Java 8 à Java 21 https://advancedweb.hu/a-categorized-list-of-all-java-and-jvm-features-since-jdk-8-to-21/

  • Nous avons déjà partagé ce lien par le passé, mais l’article est mis à jour à chaque release majeure de Java pour couvrir les dernières nouveautés. Et en particulier, Java 21 qui vient de sortir.

Eclipse Temurin ne va pas sortir son Java 21 tout de suite https://adoptium.net/en-GB/blog/2023/09/temurin21-delay/

  • Apparemment, une nouvelle licence pour le TCK (qui valide la compliance) doit être approuvée.
  • Oracle semble avoir sorti de nouveaux termes, à quelques jours de la sortie officielle de Java 21.
  • La mise à jour du TCK est arrivée le 9 octobre.
  • Comment Microsoft a pu sortir le sien avant ?

Le Financial Times propose un bel article avec des animations graphiques expliquant le fonctionnement de l’architecture de réseau de neurones de type transformers, utilisé dans les Large Language Models https://ig.ft.com/generative-ai/

  • LLM via relation entre les mots.
  • Notion de transformer, qui parse les “phrases” entières ce qui capture le contexte.
  • Discute le beam search vs greedy search pour avoir non pas le prochain mot, mais l’ensemble des prochains mots.
  • L’article parle de texte/vector embeddings pour représenter les tokens et leurs relations aux autres.
  • Il décrit le processus d’attention qui permet aux LLM de comprendre les associations fréquentes entre tokens
  • Le sujet des hallucinations est couvert.
  • Et pour éviter des hallucinations, utilisation du grounding.

The Absolute Minimum Every Software Developer Must Know About Unicode in 2023 https://tonsky.me/blog/unicode/

  • Un bel article qui explique Unicode, les encodings comme UTF-8 ou UTF-16, les code points, les graphèmes, les problèmes pour mesurer une chaîne de caractères, les normalisations de graphèmes pour la comparaison de chaîne.
  • Si vous voulez mieux comprendre Unicode, c’est l’article à lire !
  • Unicode, c’est un mapping chiffre - caractère en gros.
  • 1,1 million de caractères disponibles, dont 15% définis et 11% pour usage privé : il reste de la place. Et non les emojis ne prennent pas beaucoup de place.
  • Par exemple Apple utilise les usages privés pour délivrer le logo Apple dans les fonts du Mac (mais pas ailleurs).
  • UTF est l’encoding du chiffre de l’unicode.
  • UTF-32: 4 bytes tout le temps, UTF-8, encodage variable de 1 à 4 bytes (compatible avec ASCII) ; il a aussi un peu de détection d’erreurs (prefix des bytes différents).
  • Optimisé pour le latin et les textes techniques genre HTML.
  • Problème principal : on ne peut pas déterminer la taille en comptant les bytes, ni aller au milieu d’une chaine directement (variable).
  • UTF-16 utilise 2 ou plus de bytes et est plus sympa pour les caractères asiatiques.
  • Un caractère, c’est en fait un graphème qui peut être fait de plusieurs codepoints : é = e U+0065 + ´ U+0301 ; ☹️ (smiley qui pleure) is U+2639 + U+FE0F.
  • D’ailleurs selon le langage ":man-facepalming::skin-tone-3:".length = 5, 7 en java, 17 en rust ou 1 en swift. Ça dépend de l’encodage de la chaine (UTF-?).
  • ““I know, I’ll use a library to do strlen()!” — nobody, ever.”
  • En java, utiliser ICU.
  • Attention java.text.BreakIterator supporte une vieille version d’Unicode, donc ce n’est pas bon.
  • Les règles de graphème changent à chaque version majeure d’Unicode (tous les ans).
  • Certains caractères comme Å ont plusieurs représentations d’encodage, donc il y a de la normalisation : NFD qui éclate en pleins de codepoints ou NDC qui regroupe au max.
  • Normaliser avant de chercher dans les chaines.
  • Certains Unicode sont représentés différemment selon la LOCALE (c’est la life).
  • Et ça continue dans l’article…

JBang permet d’appeler Java depuis Python via un PyPI https://jbang.dev/learn/python-with-jbang/

  • C’est particulièrement intéressant pour appeler Java depuis son Jupyter notebook.
  • Ça fait un appel à un autre process (mais installe JBang et Java au besoin).

Librairies

Quarkus 3.4 est sorti https://quarkus.io/blog/quarkus-3-4-1-released/

  • Un CVE donc mettez a jour vos Quarkus.
  • Support de Redis 7.2.
  • Plus de granularité sur la désactivation de Flyway globalement ou par data source. Depuis l’activation transparente et automatique en 3.3.
  • quarkus update est l’approche recommandée pour mettre à jour.

Comment tester si un thread virtuel “pin” https://quarkus.io/blog/virtual-threads-3/

  • Exemple avec quarkus.
  • Comment générer la stacktrace.
  • Et un utilitaire JUnit qui fait échouer le test quand le thread pin.
  • Une série d’articles de Clement sur les threads virtuels et comment les utiliser dans quarkus https://quarkus.io/blog/virtual-thread-1/.

À la découverte de LangChain4J, l’orchestration pour l’IA générative en Java https://glaforge.dev/posts/2023/09/25/discovering-langchain4j/

  • Guillaume nous parle du jeune projet LangChain4J, inspiré du projet Python LangChain, qui permet d’orchestrer différents composants d’une chaine d’IA générative.
  • Grâce à ce projet, les développeurs Java ne sont pas en reste, et n’ont pas besoin de se mettre à coder en Python.
  • LangChain4J s’intègre avec différentes bases vectorielles comme Chroma ou WeAviate, ainsi qu’une petite base en mémoire fort pratique.
  • LangChain4J supporte l’API PaLM de Google, mais aussi OpenAI.
  • Il y a différents composants pour charger/découper des documents et pour calculer les vector embeddings des extraits de ces documents.
  • Vidéo enregistrée à Devoxx sur ce thème : https://www.youtube.com/watch?v=ioTPfL9cd9k.

Infrastructure

OpenTF devient OpenTofu https://www.linuxfoundation.org/press/announcing-opentofu

Dans les Dockerfiles, on peut utiliser la notation “heredocs” : <<EOF, des commandes, puis EOF pour indiquer une suite de commandes à exécuter https://www.docker.com/blog/introduction-to-heredocs-in-dockerfiles/

  • C’est comme faire un seul RUN avec des commandes séparées par des &&, mais en plus sympa parce que ça ressemble à un script Bash classique.
  • Par contre, c’est spécifique Docker et ça n’est pas portable sur Podman ou autre.

Docker annonce un nouveau protocole pour signer ses images OpenPubkey https://www.linuxfoundation.org/press/announcing-openpubkey-project

  • Sigstore répond : https://blog.sigstore.dev/openpubkey-and-sigstore/.
  • OpenPubkey s’appuie sur OIDC.
  • C’est un repo GitHub pour l’instant.
  • Pas de tier de confiance en dehors du OIDC provider.
  • OIDC lie une identité à une clé de chiffrement via une extension de l’ID token.
  • OIDC devient une preuve de possession.
  • Purement client side via la signature de l’ID token.
  • Ils utilisent le nonce pour stocker la clé publique et la signer cryptographiquement.
  • Vs Sigstore : plus d’élément central comme le transparency log et l’autorité de certification.
  • Pour le projet Sigstore, ils n’ont pas utilisé cette architecture parce que la privacy des identités, notamment en cas de renommage et sur le long terme, n’est pas respectée.
  • La rotation de clés et la partie client side devient beaucoup plus complexe (OIDC quoi) et ouvre des risques de sécurité (bugs d’implémentation).
  • La clé des OIDC providers est rotatée et ce n’est pas expliqué dans le flow OpenPubkey.
  • La complexité passe de server side à client side (vu que le nonce est la clé du système).
  • Le client notamment va devoir tracker les clés de signature des providers OIDC tout le temps (ou un système devra le faire).
  • L’ID token typiquement a plus d’infos qui vont leaker en tant que certificat du truc signé (privacy).

Cloud

Oracle Cloud rajoute GraalOS https://blogs.oracle.com/java/post/introducing-graalos

  • Plateforme serverless sans container.
  • Application native.
  • En fait des applis compilées avec GraalVM native image.

Web

Comment créer le plus petit conteneur qui sert du contenu statique https://lipanski.com/posts/smallest-docker-image-static-website

  • En utilisant les images Busybox.
  • On peut descendre à environ 150 Ko.
  • À voir la scalabilité.
  • Et les CVEs.

The state of WebAssembly in 2023 https://blog.scottlogic.com/2023/10/18/the-state-of-webassembly-2023.html

  • Rust et JavaScript voient leur popularité lorsqu’ils ciblent Wasm.
  • Wasm est toujours beaucoup utilisé pour le développement web, mais aussi pour le serverless ou comme host pour système de plugins.
  • L’étude montre que les développeurs sont intéressés par les threads, le garbage collection et le nouveau modèle de composants.
  • Côté WASI, toutes les propositions sur le thème I/O retiennent l’attention comme : le support de HTTP, du filesystem, ou les sockets… pourtant, c’est ce que l’approche WASIX proposait, même si elle n’a pas été très bien reçue par la communauté.

Data & IA

AWS investit 4 milliards dans Anthropic.ai et devient actionnaire minoritaire https://twitter.com/didiergirard/status/1706226172428701896?s=61&t=cvEVELchNh1NmF0qxg2GgA

  • Depuis quelque temps, beaucoup de personnes se demandaient où en était AWS dans le domaine GenAI. La réponse vient de tomber.
  • Plutôt que de développer sa propre technologie comme le fait Google, Amazon adopte la stratégie de Microsoft avec OpenAI en investissant dans un pure player et en lui fournissant de la puissance de calcul.
  • AWS deviendra le principal fournisseur cloud d’Anthropic, en fournissant son infrastructure à base de puces AWS Trainium et Inferentia.
  • La technologie d’Anthropic sera ajoutée au catalogue d’Amazon Bedrock. Les entreprises pourront personnaliser et affiner les modèles sur AWS.
  • Claude 2 propose une fenêtre contextuelle de 100 000 tokens, que les entreprises pourront utiliser.
  • Dans le cadre de cet investissement, Amazon acquiert une participation minoritaire dans @AnthropicAI. La structure de gouvernance d’Anthropic reste inchangée.
  • L’annonce : https://www.anthropic.com/index/anthropic-amazon.
  • Merci Didier Girard pour ce résumé.

Article d’opinion : les bases de données vectorielles ne sont pas une catégorie de base de donnée séparée https://nextword.substack.com/p/vector-database-is-not-a-separate

  • On a vu l’émergence de nouvelles bases de données de type vectoriel ces deux dernières années : Pinecone, Milvus, Weaviate, Qdrant…
  • Mais les DB existantes sont toutes en train de rajouter le support des vecteurs dans leur moteur.
  • Pour la “data gravity” : c’est plus facile d’avoir ses données au même endroit que d’en avoir dans différentes bases malgré leur corrélation.
  • Pour capturer le use case de “Retrieval Augmented Generation”, en utilisant les Large Language Model pour récupérer de l’info dans ces bases de données vectorielles.
  • Je pense qu’on verra aussi les DB vectorielles ajouter également plus de fonctionnalités de requêtage qui leur manquent.

Chat GPT: voix et image https://openai.com/blog/chatgpt-can-now-see-hear-and-speak

  • OpenAI a annoncé de nouvelles fonctionnalités vocales et d’image pour ChatGPT.
  • OpenAI a publié un article décrivant leurs efforts de test avec GPT-4V. Ils ont utilisé le modèle dans un outil appelé Be My AI, qui aide les personnes malvoyantes en décrivant le contenu des images : https://cdn.openai.com/papers/GPTV_System_Card.pdf.
  • L’article résume l’évaluation du modèle GPT-4V par OpenAI, qui inclut des tests de comportement, de sécurité, et de capacité médicale, mais conclut que le modèle n’est pas approprié pour des fonctions médicales.

L’IA, c’est pas rentable https://www.tomshardware.com/news/microsoft-lost-money-on-ai

  • Copilot dépense 20$ par utilisateur qui ramène 10$.
  • Il va donc y avoir de la rationalisation après l’acquisition rush d’utilisateurs.
  • En augmentant les prix.
  • En mettant des limites plus restrictives.
  • En utilisant des modèles plus simples et plus légers.
  • Peut-être avec du hardware plus optimisé en coût.
  • C’est intéressant que l’IA est déjà trop puissante pour son coût et pas encore assez pour être suffisante. Loi de Moore ?v
  • MS dit que ce chiffre est faux, mais ne donne pas le vrai chiffre.

Outillage

Amazon acquiert Fig https://techcrunch.com/2023/08/29/amazon-fig-command-line-terminal-generative-ai/

  • On en parlait récemment.
  • C’est un terminal boosté à l’IA.

Introduction de TestContainer Desktop https://www.infoq.com/news/2023/09/testcontainers-desktop/

  • Vient de l’appli proprio TestContainer Cloud Desktop.
  • Permet de mettre les ports fixes (plus facile à debugger).
  • Le gel des containers pour laisser le container tourner pour l’inspection
  • Supporte les moteurs de containers alternatifs à Docker (dont Podman et d’autres que je ne connaissais pas).

Nouvelle version 1.7 de jq, l’outil en ligne de commande pour examiner/modifier vos documents JSON https://github.com/jqlang/jq/releases

  • Utilisation des nombres décimaux pour ne pas perdre de précision.
  • Une fonction pick(stream) pour faire des projections et ne garder que les champs qui nous intéressent.
  • Une fonction debug() pour loguer des messages sur stderr.
  • Une fonction abs() pour calculer la valeur absolue.
  • Et plein d’autres petits raffinements et correctifs de bugs.
  • La version d’avant datait de novembre 2018.

Pratiques de Dogfooding : utiliser tes propres outils comme GitHub utilise GitHub actions pour son propre système CI https://www.infoq.com/news/2023/10/running-GitHub-using-actions/

  • Avoir des runners plus larges.
  • Donner l’accès à des resources privées au runner via une gateway qui reçoit un token OIDC specific au runner.
  • Workflow réutilisables.
  • Sortie de workflows réutilisables pour optimiser si le git id est le même qu’un run ancien.

Sondage de la communauté TestContainer https://www.atomicjar.com/2023/09/state-of-local-development-and-testing-2023/

  • TestContainer pour plus de 10 languages, pas juste Java.
  • RDBMS puis message brokers et les bases nosql sont la majorité des usages.
  • Mais pas que (serveur web, émulateur de cloud, microservices internes).
  • 40% des utilisateurs utilisent autre chose que Docker Desktop (docker engine, podman, rancher etc).
  • TestContainer au moment du dev et pas que pour les tests.

Architecture

Vous êtes plutôt logging ou plutôt tracing ? https://andydote.co.uk/2023/09/19/tracing-is-better/

  • L’article essaie de démontrer que le tracing, c’est mieux que le logging.
  • L’imbrication des traces permet de mieux voir la corrélation que des logs.
  • Les traces donnent des informations de durées, pas que des timestamp.
  • On peut rajouter des attributs à ses traces, ce qui rend plus facile le requêtage, plutôt que de faire des greps sur des messages de log.

Méthodologies

On a construit un produit top et ça a échoué Earthly.dev raconte https://earthly.dev/blog/shutting-down-earthly-ci/

  • Outil de CI/CD qui évite de répéter les tâches…
  • Comme startup, tu ne releases pas un produit mature et complet en fonctionnalités.
  • Mais peut-être 10x meilleur sur une chose spécifique qui peut faire oublier les manques à certains.
  • Quand tu captures ces premiers, tu investis et étends, et tu répètes.
  • Si au début ce différenciateur n’attire personne, ajouter des features ne va pas aider, c’est une recette pour construire quelque chose que personne ne veut.
  • Ils ont construit leur plan de domination en étapes indépendantes, des produits plus focalisés.
  • Et le premier produit “gratuit” ne cannibalisait pas les seconds produits, car ils adressaient différents problèmes (donc pas de risque sur le business model).
  • Le premier produit construit par une personne a été beaucoup adopté.
  • Le deuxième (remote workers) a aussi été adopté avec des gens qui faisaient en DIY, et quand ils ont fait une offre managée, les gens sont venus.
  • Les CI traditionnelles lançaient le job et le reste était délégué à Earthly et Earthly Satellites (le cœur du build).
  • Il ne restait plus qu’à allumer le troisième étage Earthly CI, mais c’est parti en cacahuete.
  • La population intéressée n’était pas des fans qui avaient déjà fait le job du produit, ils demandaient en quoi la CI était différente, le coût de migration et ils n’ont jamais pu gagner.
  • Au lieu d’une grass root install, il y avait un long mur de migration à passer.
  • La clé, c’est que vendre aux devs avec un GTM direct ne marche pas, ils doivent essayer et adopter par eux-mêmes.
  • Les développeurs vont acheter un outil de dev, mais tu ne peux pas leur vendre.

horcrux https://github.com/jesseduffield/horcrux

  • Permet de chiffrer un fichier en plusieurs morceaux, et il faut avoir un certain nombre de fragments pour rassembler le fichier entier.
  • Ne nécessite aucun mot de passe.

Sécurité

Des pseudos chercheurs en sécurité utilisent Bard pour reporter un CVE pour le projet cURL https://hackerone.com/reports/2199174

  • Heureusement, Daniel Steinberg (le créateur de cURL) et les mainteneurs du projet ont rapidement détecté la supercherie.
  • Les LLMs sont super créatifs : ils ont déjà vu dans leur corpus d’entrainement des pages de CVE, et sont donc capables d’en imaginer aussi !
  • Mais imaginez le temps perdu par les mainteneurs de projet OSS s’ils doivent du coup perdre leur temps à vérifier de telles inepties ?
  • Au nez et à la Bard de l’IA.

Loi, société et organisation

Cisco achète Splunk pour 28 milliards https://techcrunch.com/2023/09/21/cisco-to-acquire-splunk-in-28b-mega-deal/

  • Bouge cisco plus dans le software.
  • “synergétique”.
  • Objectif : un géant de l’observabilité et la sécurité.
  • Avec de l’IA parce que c’est comme ça qu’on justifie ces achats.
  • Cet achat doit encore être validé par les autorités de concurrence.
  • Quelque part en 2024.

Les fondations comme Eclipse ont peur du Cyber Résilience Act Européen tel que présenté jusqu’à présent https://newsroom.eclipse.org/news/announcements/cra-should-support-open-practices-open-source-and-development-european-open

  • Ils demandent une clarification sur les contraintes réglementaires.
  • Notamment d’exclure les fondations / associations et laisser le poids sur les sociétés qui fourniraient les projets open sources des fondations dans le cadre d’un accord commercial, pas juste de le fournir en téléchargement.
  • Réutiliser la validation de compliance des sociétés commerciales par les fondations.
  • Autre article de la linux foundation : https://www.linuxfoundation.org/blog/understanding-the-cyber-resilience-act.
  • Fourniture de matchs, auditing, fournir des mises à jour.
  • Bouge la responsabilité de l’utilisateur vers le développeur du logiciel.
  • Un individu qui ne reçoit pas de contribution ni ne fait de consulting ⇒ exclu.
  • Fondations et sociétés commerciales ⇒ inclues.
  • Défini des classes de logiciels de non critique à classe 1 et 2.
  • Doit faire un risk assessment avant de livrer (pas de bug de sécurité, secure par défaut, security update).
  • De la doc sur le process d’évaluation des risques et un SBOM notamment.
  • Notifier d’une vulnérabilité en moins de 24h.
  • Il y a une campagne : #FixTheCRA.

Des protestations contre l’ouverture des modèles d’IA de Meta https://spectrum.ieee.org/meta-ai

  • Ouvrir les modèles et leurs poids permet aux acteurs de bypasser les restrictions (biais etc).
  • Donc des gens de Meta protestent contre la politique open source de Meta dans ce domaine.
  • L’argument, c’est qu’un modèle derrière une API peut être éteint.
  • Les partisans de l’avis contraire pointent que contourner les restrictions de ChatGPT a été trivial jusqu’à présent.
  • Et que l’obscurité amène à un déficit de transparence, de connaissance du public.
  • Va affecter les chercheurs indépendants.
  • Cela dit, ce n’est pas de l’open source pur, car les sources et comment le modèle est entrainé est peu publié.
  • L’OSI travaille à une définition d’Open Source AI.

Un site pour mettre une pause à l’IA https://pauseai.info/

  • NOUS RISQUONS DE PERDRE LE CONTRÔLE
  • NOUS RISQUONS L’EXTINCTION DE L’HUMANITÉ
  • NOUS AVONS BESOIN D’UNE PAUSE
  • NOUS DEVONS AGIR IMMÉDIATEMENT
  • Il y a un agenda des manifestations à travers le monde (Londres, Bruxelles, SFO… mais où est Paris ?).
  • Twitter/Discord/Facebook/TikTok/LinkedIn.
  • Alors qui va gagner la course à l’extinction de l’humanité ? La guerre, le réchauffement climatique ou l’IA ?
  • Sarah Connor !!!

Outils de l’épisode

Un QWERTY adapté pour les lettres à accent https://altgr-weur.eu/ (via Thomas Recloux)

Conférences

Toutes les vidéos de Devoxx Belgique sont disponibles sur https://www.youtube.com/@DevoxxForever.

Hacktoberfest, édition 10 https://hacktoberfest.com/.

La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 300 - Interview de Jean-Michel Doudoux sur Java 21 par Charles Sabourdin

Posté le 18/09/2023

Dans cet épisode Charles Sabourdin interview Jean-Michel Doudoux sur la sortie de la nouvelle version LTS de Java en 2023 : Java 21.

Enregistré le 5 septembre 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-300.mp3

Java 21

The art of long-term support and what LTS means for the Java ecosystem

JDK 21

À propos de Jean-Michel Doudoux

À propos de ParisJug

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 299 - Katia est dans la place !

Posté le 11/09/2023

Dans cet épisode de rentrée, Antonio et Arnaud ont le plaisir d’accueillir Katia Aresti dans l’équipe. Ils passent en revue les dernières nouveautés et sujets chauds de cette rentrée, notamment la sortie de Java 21, les nouvelles versions de Quarkus, Micronaut, Hibernate, NodeJS, Redis, et bien d’autres encore. Ils discutent de sujets plus généraux tels que l’observabilité, la nouvelle tendance “Platform Engineering”, et la productivité des développeurs. Ils abordent aussi les sujets sur la sécurité, tels que les failles sur les CPUs Intel et AMD, ainsi que la vie privée, avec les Tracking APIs de Chrome, Firefox et le projet de loi SREN. Le tout est agrémenté de sa dose d’IA, avec des librairies telles que Semantic Kernel, ainsi que des sujets plus haut niveau tels que Google Gemini, Meta GPT, LLama 2, et les biais et la consommation énergétique de l’IA.

Enregistré le 8 septembre 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-299.mp3

News

Langages

Apache Groovy a 20 ans! https://twitter.com/ApacheGroovy/status/1695388098950217909

Java 21 arrive le 19 septembre https://www.infoworld.com/article/3689880/jdk-21-the-new-features-in-java-21.html

  • C’est la nouvelle LTS.
  • Pas mal de nouvelles fonctionnalités comme les virtual threads, le pattern matching sur les switch, sequenced collections…
  • Retrouvez le 19 septembre une interview de Jean-Michel Doudoux par Charles Sabourdin pour l’épisode 300 des Cast Codeurs !

Librairies

Semantic Kernel pour Java est (en train de) sortir : https://devblogs.microsoft.com/semantic-kernel/introducing-semantic-kernel-for-java/

  • Framework OSS pour faire de l’IA.
  • .Net et Python.
  • Java 0.2.7 Alpha est publié.
  • Kernel car il est tout petit.
  • Se connecte à plusieurs fournisseurs (aujourd’hui OpenAI, Azure AI, Hugging Face), plusieurs DB vectorielles, plusieurs templates de prompt (suit la specification de OpenAI).

OpenSSL : qui committe ? https://www.openssl.org/blog/blog/2023/07/17/who-writes-openssl/

  • En majorité des OSS payés.
  • Puis des gens payés par leur boite.
  • Et enfin des contributeurs non payés.
  • c’est rapide, mais ça montre que depuis heartbleed, ça a changé

Micronaut 4.1.0 https://micronaut.io/2023/09/01/micronaut-framework-4-1-0-released/

  • Bean Mappers pour créer automatiquement une correspondance entre un type et un autre.
  • Un Introspection Builder : l’annotation @Introspected pour générer un builder dynamique si un type ne peut être construit que via un modèle builder.
  • Améliorations pour les développeurs utilisant Kotlin Symbol Processing (KSP).

Quarkus 3.3.1 / 3.3.2

Hibernate ORM 6.3.0 et 6.2.8 et Hibernate Reactive 2.0.5 https://hibernate.org/orm/

  • Un support initial de la spécification Jakarta Persistence 3.2.
  • Un nouveau guide d’introduction Hibernate 6, un nouveau guide de syntaxe et de fonctionnalités pour le langage de requête Hibernate (Hibernate Query Language).
  • Annotation @Find sur des méthodes → créer des méthodes de recherche similaires aux méthodes de requête.
  • Reactive compatible avec Hibernate ORM 6.2.8, certains changements d’API.

Infrastructure

Une série d’articles sur l’observabilité par Mathieu Corbin

Web

NodeJS 20.6.0 est disponible et ajoute le support des fichiers .env https://philna.sh/blog/2023/09/05/nodejs-supports-dotenv/

  • Configurable avec l’option --env-file.
  • Le fichier .env peut contenir des variables d’environnement et commentaires #.
  • Attention par contre : pas de lignes multiples ni d’extension de variables.
  • Vous pouvez par exemple configurer NODE_OPTIONS avec ce système.

Data

Redis 7.2 est sorti ! https://redis.com/blog/introducing-redis-7-2/

  • Auto-tiering : cette nouvelle fonctionnalité permet de stocker les données sur des supports de stockage différents, en fonction de leur importance et de leur fréquence d’accès. Cela permet d’améliorer les performances et la scalabilité de Redis.
  • RESP3 : cette nouvelle version du protocole RESP permet une communication plus efficace entre Redis et les clients.
  • Improvements to performance : de nombreuses améliorations de performances ont été apportées à Redis 7.2, notamment pour les opérations de lecture et d’écriture.
  • New commands : plusieurs nouvelles commandes ont été ajoutées à Redis 7.2, notamment :
    • CLIENT NO-TOUCH : cette commande permet d’empêcher un client d’être touché par une opération AOF ou RDB.
    • WAITAOF : cette commande permet d’attendre que l’AOF soit écrite avant de poursuivre l’exécution.
  • Dans le podcast sont cités les hot replacement de Redis, comme Dragonfly.

Architecture

Article sur Google Gemini et sa capacité à battre ChatGPT https://www.semianalysis.com/p/google-gemini-eats-the-world-gemini

  • Google a raté les premiers pas (ils avaient le meilleur LLM public avant ChatGPT 3).
  • Et les chercheurs qui inventent les champs de LLMs.
  • Google va 5x ChatGPT-4 avant la fin de l’année, mais vont-ils les publier ?
  • Les chercheurs se tirent la bourre sur le nombre de GPU (H100) auxquels ils ont accès ; ce sont les grosses organisations comme Meta, OpenAI et Google.
  • Et les autres qui luttent avec des GPUs qui n’ont pas assez de VRAM et ce qu’ils vont faire c’est de la merde et sans consequence.
  • Le peuple utilise le modèle dense de LLAMA mais, pour les environnements contraints, ça serait mieux des sparse models et du speculative decoding.
  • Ils devraient se concentrer sur la performance de modèle qui utilise plus de compute et mémoire en évitant de consommer de la bande passante de memoire, c’est ce dont l’edge computing a besoin.
  • Les benchmarks publics ne mesurent pas des choses utiles.
  • Même HuggingFace est dans la category des GPU-poor.
  • Nvidia est en train de se construire une machine de guerre (service).
  • La Chine et les US vont être en compétition, mais l’Europe qui reste GPU-poor ne va pas s’en sortir.
  • Les startups ne peuvent pas payer les GPUs en action, il faut du cash.
  • Tout le monde rempli les poches de Nvidia, sauf Google.
  • Google grossi exponentiellement ses propres GPUs.

Meta GPT https://www.infoq.com/news/2023/08/metagpt-agent-collaboration/

IA : biais et durabilité par Leslie Miley, tech advisor du CTO de Microsoft https://www.infoq.com/presentations/ai-bias-sustainability

  • Nouvelles infrastructures.
  • La consommation énergétique et d’eau des datacenters pour l’IA est terriblement élevée.
  • L’impact des infrastructures sur les communautés (bruit).
  • Explique bien son point de vue sur les problèmes d’amplification des biais de l’IA.
  • Propose des stratégies pour atténuer l’impact.

Kubeflow, le toolkit pour deployer machine learning (ML) workflow en Kubernetes, est accepté par la CNCF https://www.infoq.com/news/2023/08/kubeflow-cncf-project

Méthodologies

Measuring developer productivity? A response to McKinsey by Kent Beck and Gergely Orosz (pragmaticengineer.com) https://tidyfirst.substack.com/p/measuring-developer-productivity

  • McKinsey a sorti un article où ils expliquent la recette miracle recherchée par tous les managers comme le graal : Comment mesurer la productivité des développeurs ? (faut bien vendre du conseil)
  • Kent et Gergely partent d’un modèle mental de description de la création de valeur par le développeur pour ensuite voir quels sont les besoins de mesurer la productivité et comparent cela avec d’autres secteurs (la vente, le support, le recrutement).
  • Ils concluent cette première partie avec les compromis à faire pour que ce type de mesures ait un intérêt sans impacter trop négativement les développeurs.
  • Un autre article dans la même lignée par Martin Fowler : https://martinfowler.com/bliki/CannotMeasureProductivity.html.

Et si on parlait de Platform Engineering ?

On call Process (Astreinte), startup TinyBird par VP Engineering Félix López (ex google, ex eventbrite) https://thenewstack.io/keeping-the-lights-on-the-on-call-process-that-works/

  • Si votre produit est SAAS, on doit avoir des astreintes. Cela impose un lourd fardeau à ceux qui doivent être en astreinte, surtout en petite entreprise.
  • Petites entreprises évitent avoir un processus d’astreinte formel pour éviter le stress. Cela crée dans la pratique plus de stress : si personne n’est responsable, tout le monde est responsable.
  • Tinybird est la plateforme de données en temps réel pour les développeurs et les équipes de données. Pré-création du process formel chez Tinybird : désorganisé, non structuré et stressant.
  • Mise en place : Principes fondamentaux d’un processus d’astreinte : L’astreinte n’est pas obligatoire, minimiser le bruit, pas seulement pour les SRE, alert = runbook, avoir des backups pour la personne en astreinte, appeler quelqu’un devrait être la dernière solution, minimiser le temps en astreinte.
  • L’article explique comment ils sont passés de regarder chaque alerte (comprehensible ?, exploitable ?), puis avoir un board grafana pour chacune et plan spécifique. Une fois le tri fait, tout migré vers un seul channel de com, et manuel d’astreinte pour chaque alerte. Itérer.
  • Multiples benefices sur le long terme : rapports d’incident ouvert, atténuer les problèmes futurs, renforcement la propriété et les connaissances du code et systèmes au sein de toute l’équipe…

Sécurité

Downfall, une nouvelle faille de sécurité sur les processeurs Intel (https://www.lemondeinformatique.fr/actualites/lire-la-faille-downfall-met-a-mal-des-milliards-de-processeurs-intel-91247.html) et AMD ne fait pas mieux avec une faille nommée Inception (https://www.lemondeinformatique.fr/actualites/lire-les-puces-amd-vulnerables-a-la-faille-inception-91273.html)

  • Downfall, La vulnérabilité est due à des fonctions d’optimisation de la mémoire dans les processeurs Intel qui révèlent involontairement les registres matériels internes aux logiciels. Cela permet à des logiciels non-fiables d’accéder à des données stockées par d’autres programmes, qui ne devraient normalement pas être accessibles. Tous les PC ou ordinateurs portables équipés de processeurs Intel Core de la 6e génération Skylake jusqu’aux puces Tiger Lake de 11e génération incluses contiennent cette faille. Les derniers processeurs Core 12e et 13e génération d’Intel ne sont pas concernés.
  • Inception, nécessite un accès local au système pour être potentiellement exploité ce qui en limite de fait la portée. Tous les processeurs AMD depuis 2017 sont touchés, incluant les derniers modèles Zen 4 Epyc et Ryzen.

Comment désactiver le nouveau tracking publicitaire ciblé sur Chrome https://www.blogdumoderateur.com/chrome-comment-desactiver-tracking-publicitaire-cible/

  • Google a annoncé en juillet le déploiement de sa nouvelle API Topics, permettant « à un navigateur de partager des informations avec des tiers sur les intérêts d’un utilisateur tout en préservant la confidentialité ».
  • C’est cette API, incluse dans la version Chrome 115 de juillet 2023, qui est censée remplacer les cookies tiers.

Loi, société et organisation

Une nouvelle definition d’open pour Llama 2 ? https://opensourceconnections.com/blog/2023/07/19/is-llama-2-open-source-no-and-perhaps-we-need-a-new-definition-of-open/

  • C’est relativement “open” mais il y a des restrictions, donc pas open source.
  • Pas plus de 700 M d’utilisateurs par mois.
  • Pas le droit d’utiliser Llama pour améliorer des autres modèles autres que des dérivés de Llama.
  • Et c’est le modèle final qui est ouvert, pas la sauce pour le construire, donc pas de maven build ni le “source code” pour y arriver “from scratch”.
  • Attention au risque de sacrifier l’open source pour avoir l’IA plus vite, plus facile.

HashiCorp passe tous ses projets open source en BSL, comme Confluent, Mongo, Redis, Elastic… https://thenewstack.io/hashicorp-abandons-open-source-for-business-source-license/

Stack overflow annonce Overflow AI https://www.infoq.com/news/2023/09/stackoverflow-overflowai/

  • L’intégration de l’IA générative dans leur plateforme publique, Stack Overflow for Teams, ainsi que de nouveaux domaines de produits.
  • IA/ML aident à générer des balises initiales et à suggérer des paires question-réponse, permettant aux développeurs de se concentrer sur l’amélioration et la précision.
  • Amélioration des capacités de recherche.
  • Les forums de questions-réponses basés sur la communauté sont le cœur battant de Stack Overflow. Selon Prashanth Chandrasekar, PDG de Stack Overflow, l’objectif d’OverflowAI est d’améliorer la communauté de diverses manières plutôt que de la remplacer complètement.

Vous avez entendu parler du projet de loi SREN ? http://share.mozilla.org/817319645t

  • Le gouvernement français prépare une loi qui pourrait menacer la liberté sur Internet. Le projet de loi visant à sécuriser et réguler l’espace numérique (SREN) obligerait les navigateurs web, comme Mozilla Firefox, à bloquer des sites web directement au niveau du navigateur.
  • Mozilla lance une pétition pour retirer cette énième solution stupide pour censurer Internet.

Conférences

La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/