Le podcast Java en Français

Les Cast Codeurs est un podcast en français de, par et pour les développeurs.

Prenez connaissance des dernières nouvelles de la sphère Java et du développement en général. Plongez sur un sujet précis avec les épisodes interview.

Supportez les radotages de vos hôtes : Emmanuel Bernard (JBoss, Hibernate), Arnaud Héritier (Doctolib, Jenkins), Guillaume Laforge (Google, Groovy), Antonio Goncalves (Microsoft, auteur), Vincent Massol (XWiki, Maven), Audrey Neveu (Reactor/Spring, Devoxx4Kids). Katia Aresti (Red Hat, Infinispan).

LCC 302 - Amour, Gloire et OpenAI

Posté le 27/11/2023

Dans cet épisode, Emmanuel, Guillaume et Katia abordent les nouveautés Java, le lancement du langage Misty par Douglas Crockford, l’arrivée de WasmGC dans Chrome, la sortie de Spring Framework 6.1, des évolutions dans les bibliothèques comme Vert.x 4.5, et des conseils sur la création de langages de programmation. L’épisode couvre également des actualités dans les domaines de l’infrastructure avec le premier ordinateur cloud commercial par Oxide, des annonces sur les frameworks web comme Angular v17, des réflexions sur les architectures monolithiques versus microservices, et sans oublier le soap Opéra du moins de novembre avec OpenAI en vedette.

Enregistré le 23 novembre 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-302.mp3

News

Langages

Recap Javaiste https://www.infoq.com/news/2023/10/java-news-roundup-oct09-2023

  • La JEP 454 sur l’appel à la mémoire et les API dites natives passera en target pour JDK 22, avec une façon d’ajouter les appels de méthodes restreintes sans le flag --enable-native-access (via un manifeste dans le JAR).
  • JDK 22 prévu pour mars 2024.
  • Spring Framework 6.1 est sorti.
  • Tomcat a quelques CVE, donc mettez à jour !

Douglas Crockford, le papa de JSON, sort un nouveau langage dénommé Misty https://www.crockford.com/misty/

  • Utilise des caractères unicodes pour définir des chaînes de caractères avec des chevrons, ou pour les opérateurs de base (comparison, and/or).
  • Support de la programmation concurrente avec les actors.

WasmGC arrive dans Chrome, par l’intermédiaire de v8 https://v8.dev/blog/wasm-gc-porting

  • Historiquement, il fallait compiler le port du langage lui-même (et donc son GC).
  • Maintenant, on peut compiler le code (Java) dans des primitives Wasm et WasmGC.
  • Java python et co ont des VM qui sont compilées pour toutes les architectures cibles (ARM, x86 etc), y compris le JIT, AOT.
  • Donc, on peut définir comme backend WASM lui-même, c’est l’approche classique.
  • WasmGC définit des structs et des array avec des champs dans lesquels on peut créer des instances, lire/écrire les champs, caster dans d’autres types et ces objets sont gérés par WasmGC lui-même.
  • On a un système de type du coup et des relations entre ces types.
  • Donc on représenterait les objets Java en objets Wasm.
  • Avantage et inconvenient des deux approches.
  • Tous les codes de management d’objets ne sont plus nécessaires (y compris malloc) ⇒ gain memoire.
  • En mode GC dans le langage, les liens objets du langage ↔ objets Wasm sont inefficaces, car les liens langage → Wasm définissent l’instance entière Wasm, donc des gros cycles d’objets ne sont pas GCed.
  • Wasm sandbox empêche d’inspecter la stack et d’éliminer des objets plus efficacement, et il n’y a pas d’API pour aider donc seul WasmGC peut utiliser cet avantage.
  • Un seul GC a des avantages : meilleure gestion de la pression mémoire.
  • Mais on réutilise le GC du Web (genre V8) vs celui de Java. (c’est moins un problème pour les autres langages avec des GC moins sophistiqués).
  • La fragmentation mémoire est plus proéminente quand on a des modules de type C qui peuvent garder des gros blocs mémoire “quasi-vides” (opaque). C’est managé plus finement en WasmGC.
  • Sémantiques de langage est plus dur à achever vu qu’on map en concepts WasmGC, il y a de la transformation.
  • Sémantiques des chaînes de caractères, nombres, etc peuvent être un peu ajustés.
  • Un port utilisant WasmGC n’est pas une réécriture de tout, mais un gros morceau de la VM du langage cible est à réécrire.
  • WasmGC peut optimiser comme les patterns en JVM, mais en WasmMVP c’est la toolchain avant qui fait le travail d’optimisation (p. ex. LLVM).
  • Donc avec WasmGC, la toolchain fera les optimisations de langage et WasmGC fera les optimisations low-level (inlining, constant propagation, dead code elimination).
  • Puis d’autres optimisations spécifiques à WasmGC comme les escape analysis.
  • Et ils parlent d’optimisations dans V8 pour approcher les appels dynamiques à la Java (pas défini à la compilation).

Écrire un langage de programmation… ça prend du temps… beaucoup de temps https://yorickpeterse.com/articles/a-decade-of-developing-a-programming-language/

  • Évitez le gradual typing.
  • Évitez le boostrapping de votre compilateur.
  • Évitez d’écrire votre propre générateur de code, linker, etc.
  • Évitez de tergiverser trop longtemps sur la syntaxe.
  • La prise en charge multiplateforme est un défi.
  • Les livres sur les compilateurs ne valent pas l’argent que vous dépenserez dessus.
  • Faire grandir et évoluer un langage de programmation est difficile.
  • La meilleure suite de tests est une application réelle.
  • Ne privilégiez pas les performances sur les fonctionnalités.

Librairies

Spring Boot rajoute le hot reload des certificats SSL pour embedded Netty et Tomcat https://spring.io/blog/2023/11/07/ssl-hot-reload-in-spring-boot-3-2-0

  • Utilisez reload-on-update: true.
  • Et écoute les changements de fichiers.
  • Pas mal dans les déploiements non-immuables (pas comme Kubernetes).

VertX 4.5 est sorti https://vertx.io/blog/whats-new-in-vert-x-4-5/

  • Support des threads virtuels qui permet d’écrire le code synchrone pour des cas complexes et utiliser les threads locaux dans ces cas-là. Cela ne remplace pas le code de process des événements.
  • Le code peut faire des future / await qui ne bloqueront pas le thread principal.
  • Connection SQL dynamique : quand le host change dynamiquement dans l’application.
  • Support des proxies de niveau 7 pour les clients SQL.
  • Rotation des certificats à chaud.
  • Des builders (HTTP, SQL connection).
  • Extensions pour utiliser les coroutines Kotlin.

Integration déclarative de Langchain4j dans Quarkus https://quarkus.io/blog/quarkus-meets-langchain4j/

Infrastructure

Oxide sort le premier ordinateur cloud disponible commercialement https://oxide.computer/blog/the-cloud-computer

  • Pas facile de séparer le buzz de la réalité.
  • On dirait un ordi purpose built avec l’efficience et le côté compact en tête.
  • Ils poussent contre le mode location uniquement des cloud providers.
  • En gros inspiré des cloud providers qui construisent leurs propres ordis (et même CPUs maintenant !).
  • Construit le hardware et le software en co-optimisation.
  • C’est un rack entier, peu de bruit de ventilateur.
  • Pas de cable (seul E/S du rack).
  • Donc ils ont leurs propres switch.
  • Compliqué de différencier l’avantage du désavantage.

Les leçons tirées de 20 de Site Reliability Engineering par Google https://sre.google/resources/practices-and-processes/twenty-years-of-sre-lessons-learned/

  • Le risque d’une mitigation doit être proportionné à la gravité de la panne.
  • Les mécanismes de récupération doivent être entièrement testés avant une urgence.
  • Canarisez tous les changements.
  • Avoir un “gros bouton rouge”.
  • Les tests unitaires ne suffisent pas, des tests d’intégration sont également nécessaires.
  • CANAUX DE COMMUNICATION ! ET CANAUX DE SECOURS !! ET DES SAUVEGARDES POUR CES CANAUX DE SECOURS !!!
  • Modes de dégradation intentionnel des performances.
  • Tester la résilience aux catastrophes.
  • Automatisez vos mitigations.
  • Réduisez le temps entre les déploiements, afin de diminuer la probabilité que le déploiement tourne mal.
  • Une seule version matérielle globale est un point de défaillance unique.

Karpenter une évolution d’Autoscaler pour les clusters Kubernetes https://blog.ippon.fr/2023/11/07/mettez-a-lechelle-vos-clusters-kubernetes-de-maniere-efficace-et-faites-des-economies-avec-karpenter/

  • Fonctionne uniquement pour AWS aujourd’hui, donc à voir la portabilité.
  • Permet d’ajouter ou de supprimer des nœuds au cluster Kubernetes en dynamique pour rightsizer ses clusters.
  • Bypass les API kube pour la creation d’instance et utilise les APIs AWS EC2 directement.
  • Permet des nœuds hétérogènes (pas homogène comme Autoscaler).
  • Et se rightsize rapidement (p. ex. 30s pour éteindre un nœud).
  • Besoin d’applis cloud-natives, car elles vont être baladées.

Web

Deno ! https://www.infoq.com/news/2023/10/deno-jupyter-integration

  • Dev experience, jupyter notebook integration.
  • Améliorations sur Visual Studio Code extension (compatible avec NodeJS).
  • L’exécution native sur Jupyter de Javascript et Typescript permet d’effectuer des analyses de données, construire des modèles d’apprentissage automatique et générer des rapports interactifs avec Deno.
  • Visualisations dynamiques avec D3 dans le notebook.
  • Connection à Deno KV.
  • Plusieurs améliorations sur le testing, APIs etc

Lancement du nouveau site angular.dev et de la version v17 du framework https://blog.angular.io/announcing-angular-dev-1e1205fa3039

Outillage

Il est possible de signer et notariser des applications pour macOS sur des machines non-Apple https://gregoryszorc.com/blog/2022/08/08/achieving-a-completely-open-source-implementation-of-apple-code-signing-and-notarization/

  • Implémenté en Rust.
  • Pratique pour les pipelines CI/CD basés sur Linux.
  • À priori, il y a des outils similaires pour le monde Windows, qui permet de signer sur une machine non-Windows : https://github.com/mtrojnar/osslsigncode.

Lors de son Github Universe, Copilot fait le show ! https://github.blog/2023-11-08-universe-2023-copilot-transforms-github-into-the-ai-powered-developer-platform/

  • Copilot Chat sera GA en décembre, il utilise GPT4, il permet de guider le développeur, de générer du code, de détecter des erreurs et aide à les corriger, d’expliquer le code.
  • Intégration à venir de Copilot Chat dans les IDEs de JetBrains.
  • Copilot Chat va être intégré sur github.com et dans l’appli mobile aussi.
  • Introduction de GitHub Copilot Enterprise pour les sociétés, qui permettra de spécialiser le modèle sur le code de l’entreprise.
  • Intégration de Copilot ans Workspace, donc quand on voudra adresser un bug, créer un pull request, Copilot pourra nous aider étape par étape, suggérer un plan d’action.
  • Copilot Enterprise permettra de faire des recherches avec le contexte entier du code de l’entreprise, donc idéalement meilleur que le focus sur un repo de Copilot.

Un guide sur OpenRewrite https://feeds.feedblitz.com/~/819402521/0/baeldung~A-Guide-to-OpenRewrite

  • Permet de refactorer le code via des règles.
  • Mise à jour des dépendances, enlever l’utilisation d’API dépréciées, migration d’une bibliothèque à une autre, etc.
  • Migration Java, migration framework, transformations spécifiques à votre société.
  • OpenRewrite vient avec un écosystème de recettes.
  • Intégration via Maven ou Gradle.
  • La suite montre des exemples de migrations.

Architecture

Article intéressant sur Monolithe vs Microservices ! https://www.infoq.com/articles/monolith-versus-microservices/

  • Le débat monolithe vs microservices. Les monolithes reviennent, par exemple Spring Modulith.
  • Les microservices sont la solution à la complexité plutôt que la cause de celle-ci. Toutes les applications deviendront complexes ; au-delà d’un certain point, les microservices nous aideront à gérer cette complexité.
  • Les microservices comportent des coûts et des avantages. Si les avantages ne l’emportent pas sur les coûts, vous n’aurez pas une expérience positive avec les microservices.
  • Nous pouvons arrêter notre transition vers les microservices quelque part au milieu du spectre, ce que j’aime appeler le modèle hybride. À ce stade, nous pouvons avoir quelques gros services mélangés à quelques petits services. Nous pouvons avoir le meilleur des deux mondes : la simplicité et la commodité du monolithe combinées à la flexibilité et à la scalabilité des microservices.
  • Il n’y a pas de choix binaire entre monolithique et microservices. En réalité, il existe un spectre de possibilités entre les deux. Si vous vous êtes fixé à l’une des extrémités du spectre, vous passez à côté de la grande variété d’architectures intermédiaires.
  • Nous devrions cesser de parler de monolithe contre microservices et plutôt avoir un débat plus nuancé sur la taille appropriée des services.
  • Les microservices mettent sur le devant de la scene la complexification du système, les monolithes le cachent sous le tapis.
  • Les microservices permettent de gérer cette complexité.
  • Automatisation est la clé dans l’adoption des microservices.
  • Bien aligner son architecture et son domain ou alors la douleur arrive.

Sécurité

Une explication de la CVE sur HTTP/2 https://quarkus.io/blog/cve-2023-44487/

  • En fonction de l’implémentation, le risque est plus ou moins grand (de plus de CPU à un full DDOS).
  • Au cœur du problème est la capacité d’envoyer pleins de requêtes en parallèle sur le meme pipeline HTTP/2.
  • Les serveurs ont en général une limite aux streams en parallèle (genre 100).
  • La CVE est exploitée côté client en ouvrant et fermant rapidement un stream, c’est plus léger sur le client, le serveur a un délai dans son processing.
  • Ce qui permet de bypasser la limite et affamer les resources du serveur.
  • C’est catastrophique en cas de one thread per request (thread starvation).
  • En event loop, c’est une queue plus grande (donc le cas de quarkus).
  • Pour mitiger, quarkus regarde le nombre de stream close requests par seconde pour détecter les abus (200 requêtes de fermeture sur une fenêtre de 30s).

Data / IA

Elon Musk annonce son LLM, appelé Grok https://x.ai/

  • Connectivité en temps réel avec Twitter !
  • Fenêtre de contexte de 25k characters.
  • Le LLM garderait le contexte de la conversation (au lieu d’avoir à toujours renvoyer toute la discussion dans le contexte, à cause du côté sans état des LLMs habituellement).
  • Le style, la personnalité, du LLM, serait assez humoristique, voire carrément sarcastique, à la Musk… et déjà sur Twitter une personne commentait en disant que c’était le LLM “anti-woke”.
  • Grok serait disponible pour les utilisateurs payants de Twitter.

OpenAI fait 4 nouvelles annonces https://openai.com/blog/new-models-and-developer-products-announced-at-devday

  • GPT-4 Turbo : leur dernier et plus puissant LLM. Il offre un contexte de 128k tokens, des prix plus bas et des quotas plus élevés. 128k c’est comme Claude.
  • Assistants API : une solution permettant de créer des mini-assistants personnalisés et de les exposer via une API. L’objectif est de faciliter l’intégration des solutions GenAI dans les applications, avec des fonctionnalités de gestion des conversations, d’interprétation de code et de RAG.
  • API pour DALL•E 3 : un modèle de 3e génération pour la génération d’images.
  • GPTs : des versions personnalisées de ChatGPT, faciles à développer même sans compétences en programmation. Une place de marché sera disponible pour monétiser ces “GPTs”.
  • Merci Didier et son X de résumer.
  • Un article plus complet de SFEIR.
  • Protection juridique en cas d’attaque de droits d’auteur.

Loi, société et organisation

Les acteurs et l’IA, deal pour arrêter la grève https://www.bbc.com/news/entertainment-arts-67364587

  • Les acteurs et les grands studios d’Hollywood ont conclu un accord le 8 novembre pour mettre fin à une grève qui a paralysé la production de films et de séries aux États-Unis pendant plusieurs mois.
  • L’accord prévoit une nouvelle convention collective de trois ans pour les acteurs (hormis les vedettes, les acteurs n’arrivent pas à gagner leur vie avec le streaming).
  • Revalorisation importante des salaires minimums ainsi que des garde-fous contre l’IA. Un système de primes pour les rediffusions en streaming.
  • Double mouvement social historique : les acteurs sont entrés en grève mi-juillet, les scénaristes depuis début mai. La paralysie du secteur a coûté au moins 6 milliards de dollars.
  • Les acteurs craignaient que les studios utilisent l’IA pour cloner leur voix et leur image, les réutiliser à perpétuité, sans compensation ni consentement. Les conditions entourant les droits des studios sur l’image des acteurs stars après leur mort a été négocié.

Chute de WeWork, dépôt de bilan https://www.maddyness.com/2023/11/06/wework-impact-coworking-france/

  • La disparition annoncée du géant mondial du coworking marque un tournant pour le secteur, y compris en France.
  • Asphyxié par une dette de près de 3 milliards de dollars.
  • Chute interminable entamée en 2019.
  • WeWork était le leader mondial du secteur et un pionnier du coworking.
  • WeWork propose 15 établissements en France, tous situés à Paris.
  • Pourtant, la demande pour le coworking ne cesse d’exploser.
  • Startups domicilient leur siège (Qonto par exemple) dans un espace de co-working.
  • Le modèle du coworking n’est pas remis en cause. WeWork, c’est un phénomène à part. Il y a eu une mauvaise gestion de départ d’une licorne qui croît à toute vitesse, en ne faisant absolument pas attention à son modèle économique de base (dit Clément Alteresco, CEO de Morning).
  • Mauvaise publicité pour le marché et les concurrents, qui considèrent qu’ils vont s’en sortir.

Les Français, les utilisateurs twitter le plus violents d’Europe? https://www.huffingtonpost.fr/france/article/les-francais-sont-les-utilisateurs-de-twitter-les-plus-violents-d-europe_225331.html

  • Les signalements de contenus, suppressions et suspensions pour propos violents et haineux au sein de X sont les plus nombreux en France, loin devant l’Allemagne et l’Espagne.
  • 16.288 suppressions de messages contre 7.160 en Allemagne et 7.743 en Espagne.
  • X explique avoir une « équipe internationale et inter-fonctionnelle » de « modérateurs humains », qui travaillent « 24 heures sur 24 avec la capacité de couvrir plusieurs langues ».

Sam Altman PDG d’OpenAI est débarqué par son conseil de surveillance https://thealgorithmicbridge.substack.com/p/why-openai-fired-sam-altman-and-what

Les groupes “Responsible AI” chez Google, Microsoft et plus récemment Meta sont détruits https://www.theverge.com/2023/11/18/23966980/meta-disbanded-responsible-ai-team-artificial-intelligence

  • Même débat chez OpenAI en fait.
  • Difficile de comprendre les raisons, à part que la course s’est accélérée.
  • L’article cite les gouvernements qui veulent réguler, mais je ne comprends pas en quoi cela influence.

Conférences

Retrouvez les conférences sur le site Developers Conferences Agenda/List par Aurélie Vache.

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 301 - Minoritaire ou majoritaire, là est la question!

Posté le 23/10/2023

Dans cet épisode, Emmanuel et Guillaume reviennent sur les nouveautés de l’écosystème Java (Java 21, SDKman, Temurin, JBang, Quarkus, LangChain4J…) mais aussi sur des sujets plus généraux comme Unicode, WebAssembly, les bases de données vectorielles, et bien d’autres sujets orientés IA (LLM, ChatGPT, Anthropic…).

Enregistré le 20 octobre 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-301.mp3

News

Langages

Gérer facilement de multiples versions de Java grâce à SDKMan! https://foojay.io/today/easily-manage-different-java-versions-on-your-machine-with-sdkman/

  • SDKMan! supporte Java, mais aussi GraalVM, JBang, Quarkus, Micronaut… (les CLIs).
  • La CLI UI est toujours un peu chelou, donc cet article est utile pour un rappel.

Tous les changements de Java 8 à Java 21 https://advancedweb.hu/a-categorized-list-of-all-java-and-jvm-features-since-jdk-8-to-21/

  • Nous avons déjà partagé ce lien par le passé, mais l’article est mis à jour à chaque release majeure de Java pour couvrir les dernières nouveautés. Et en particulier, Java 21 qui vient de sortir.

Eclipse Temurin ne va pas sortir son Java 21 tout de suite https://adoptium.net/en-GB/blog/2023/09/temurin21-delay/

  • Apparemment, une nouvelle licence pour le TCK (qui valide la compliance) doit être approuvée.
  • Oracle semble avoir sorti de nouveaux termes, à quelques jours de la sortie officielle de Java 21.
  • La mise à jour du TCK est arrivée le 9 octobre.
  • Comment Microsoft a pu sortir le sien avant ?

Le Financial Times propose un bel article avec des animations graphiques expliquant le fonctionnement de l’architecture de réseau de neurones de type transformers, utilisé dans les Large Language Models https://ig.ft.com/generative-ai/

  • LLM via relation entre les mots.
  • Notion de transformer, qui parse les “phrases” entières ce qui capture le contexte.
  • Discute le beam search vs greedy search pour avoir non pas le prochain mot, mais l’ensemble des prochains mots.
  • L’article parle de texte/vector embeddings pour représenter les tokens et leurs relations aux autres.
  • Il décrit le processus d’attention qui permet aux LLM de comprendre les associations fréquentes entre tokens
  • Le sujet des hallucinations est couvert.
  • Et pour éviter des hallucinations, utilisation du grounding.

The Absolute Minimum Every Software Developer Must Know About Unicode in 2023 https://tonsky.me/blog/unicode/

  • Un bel article qui explique Unicode, les encodings comme UTF-8 ou UTF-16, les code points, les graphèmes, les problèmes pour mesurer une chaîne de caractères, les normalisations de graphèmes pour la comparaison de chaîne.
  • Si vous voulez mieux comprendre Unicode, c’est l’article à lire !
  • Unicode, c’est un mapping chiffre - caractère en gros.
  • 1,1 million de caractères disponibles, dont 15% définis et 11% pour usage privé : il reste de la place. Et non les emojis ne prennent pas beaucoup de place.
  • Par exemple Apple utilise les usages privés pour délivrer le logo Apple dans les fonts du Mac (mais pas ailleurs).
  • UTF est l’encoding du chiffre de l’unicode.
  • UTF-32: 4 bytes tout le temps, UTF-8, encodage variable de 1 à 4 bytes (compatible avec ASCII) ; il a aussi un peu de détection d’erreurs (prefix des bytes différents).
  • Optimisé pour le latin et les textes techniques genre HTML.
  • Problème principal : on ne peut pas déterminer la taille en comptant les bytes, ni aller au milieu d’une chaine directement (variable).
  • UTF-16 utilise 2 ou plus de bytes et est plus sympa pour les caractères asiatiques.
  • Un caractère, c’est en fait un graphème qui peut être fait de plusieurs codepoints : é = e U+0065 + ´ U+0301 ; ☹️ (smiley qui pleure) is U+2639 + U+FE0F.
  • D’ailleurs selon le langage ":man-facepalming::skin-tone-3:".length = 5, 7 en java, 17 en rust ou 1 en swift. Ça dépend de l’encodage de la chaine (UTF-?).
  • ““I know, I’ll use a library to do strlen()!” — nobody, ever.”
  • En java, utiliser ICU.
  • Attention java.text.BreakIterator supporte une vieille version d’Unicode, donc ce n’est pas bon.
  • Les règles de graphème changent à chaque version majeure d’Unicode (tous les ans).
  • Certains caractères comme Å ont plusieurs représentations d’encodage, donc il y a de la normalisation : NFD qui éclate en pleins de codepoints ou NDC qui regroupe au max.
  • Normaliser avant de chercher dans les chaines.
  • Certains Unicode sont représentés différemment selon la LOCALE (c’est la life).
  • Et ça continue dans l’article…

JBang permet d’appeler Java depuis Python via un PyPI https://jbang.dev/learn/python-with-jbang/

  • C’est particulièrement intéressant pour appeler Java depuis son Jupyter notebook.
  • Ça fait un appel à un autre process (mais installe JBang et Java au besoin).

Librairies

Quarkus 3.4 est sorti https://quarkus.io/blog/quarkus-3-4-1-released/

  • Un CVE donc mettez a jour vos Quarkus.
  • Support de Redis 7.2.
  • Plus de granularité sur la désactivation de Flyway globalement ou par data source. Depuis l’activation transparente et automatique en 3.3.
  • quarkus update est l’approche recommandée pour mettre à jour.

Comment tester si un thread virtuel “pin” https://quarkus.io/blog/virtual-threads-3/

  • Exemple avec quarkus.
  • Comment générer la stacktrace.
  • Et un utilitaire JUnit qui fait échouer le test quand le thread pin.
  • Une série d’articles de Clement sur les threads virtuels et comment les utiliser dans quarkus https://quarkus.io/blog/virtual-thread-1/.

À la découverte de LangChain4J, l’orchestration pour l’IA générative en Java https://glaforge.dev/posts/2023/09/25/discovering-langchain4j/

  • Guillaume nous parle du jeune projet LangChain4J, inspiré du projet Python LangChain, qui permet d’orchestrer différents composants d’une chaine d’IA générative.
  • Grâce à ce projet, les développeurs Java ne sont pas en reste, et n’ont pas besoin de se mettre à coder en Python.
  • LangChain4J s’intègre avec différentes bases vectorielles comme Chroma ou WeAviate, ainsi qu’une petite base en mémoire fort pratique.
  • LangChain4J supporte l’API PaLM de Google, mais aussi OpenAI.
  • Il y a différents composants pour charger/découper des documents et pour calculer les vector embeddings des extraits de ces documents.
  • Vidéo enregistrée à Devoxx sur ce thème : https://www.youtube.com/watch?v=ioTPfL9cd9k.

Infrastructure

OpenTF devient OpenTofu https://www.linuxfoundation.org/press/announcing-opentofu

Dans les Dockerfiles, on peut utiliser la notation “heredocs” : <<EOF, des commandes, puis EOF pour indiquer une suite de commandes à exécuter https://www.docker.com/blog/introduction-to-heredocs-in-dockerfiles/

  • C’est comme faire un seul RUN avec des commandes séparées par des &&, mais en plus sympa parce que ça ressemble à un script Bash classique.
  • Par contre, c’est spécifique Docker et ça n’est pas portable sur Podman ou autre.

Docker annonce un nouveau protocole pour signer ses images OpenPubkey https://www.linuxfoundation.org/press/announcing-openpubkey-project

  • Sigstore répond : https://blog.sigstore.dev/openpubkey-and-sigstore/.
  • OpenPubkey s’appuie sur OIDC.
  • C’est un repo GitHub pour l’instant.
  • Pas de tier de confiance en dehors du OIDC provider.
  • OIDC lie une identité à une clé de chiffrement via une extension de l’ID token.
  • OIDC devient une preuve de possession.
  • Purement client side via la signature de l’ID token.
  • Ils utilisent le nonce pour stocker la clé publique et la signer cryptographiquement.
  • Vs Sigstore : plus d’élément central comme le transparency log et l’autorité de certification.
  • Pour le projet Sigstore, ils n’ont pas utilisé cette architecture parce que la privacy des identités, notamment en cas de renommage et sur le long terme, n’est pas respectée.
  • La rotation de clés et la partie client side devient beaucoup plus complexe (OIDC quoi) et ouvre des risques de sécurité (bugs d’implémentation).
  • La clé des OIDC providers est rotatée et ce n’est pas expliqué dans le flow OpenPubkey.
  • La complexité passe de server side à client side (vu que le nonce est la clé du système).
  • Le client notamment va devoir tracker les clés de signature des providers OIDC tout le temps (ou un système devra le faire).
  • L’ID token typiquement a plus d’infos qui vont leaker en tant que certificat du truc signé (privacy).

Cloud

Oracle Cloud rajoute GraalOS https://blogs.oracle.com/java/post/introducing-graalos

  • Plateforme serverless sans container.
  • Application native.
  • En fait des applis compilées avec GraalVM native image.

Web

Comment créer le plus petit conteneur qui sert du contenu statique https://lipanski.com/posts/smallest-docker-image-static-website

  • En utilisant les images Busybox.
  • On peut descendre à environ 150 Ko.
  • À voir la scalabilité.
  • Et les CVEs.

The state of WebAssembly in 2023 https://blog.scottlogic.com/2023/10/18/the-state-of-webassembly-2023.html

  • Rust et JavaScript voient leur popularité lorsqu’ils ciblent Wasm.
  • Wasm est toujours beaucoup utilisé pour le développement web, mais aussi pour le serverless ou comme host pour système de plugins.
  • L’étude montre que les développeurs sont intéressés par les threads, le garbage collection et le nouveau modèle de composants.
  • Côté WASI, toutes les propositions sur le thème I/O retiennent l’attention comme : le support de HTTP, du filesystem, ou les sockets… pourtant, c’est ce que l’approche WASIX proposait, même si elle n’a pas été très bien reçue par la communauté.

Data & IA

AWS investit 4 milliards dans Anthropic.ai et devient actionnaire minoritaire https://twitter.com/didiergirard/status/1706226172428701896?s=61&t=cvEVELchNh1NmF0qxg2GgA

  • Depuis quelque temps, beaucoup de personnes se demandaient où en était AWS dans le domaine GenAI. La réponse vient de tomber.
  • Plutôt que de développer sa propre technologie comme le fait Google, Amazon adopte la stratégie de Microsoft avec OpenAI en investissant dans un pure player et en lui fournissant de la puissance de calcul.
  • AWS deviendra le principal fournisseur cloud d’Anthropic, en fournissant son infrastructure à base de puces AWS Trainium et Inferentia.
  • La technologie d’Anthropic sera ajoutée au catalogue d’Amazon Bedrock. Les entreprises pourront personnaliser et affiner les modèles sur AWS.
  • Claude 2 propose une fenêtre contextuelle de 100 000 tokens, que les entreprises pourront utiliser.
  • Dans le cadre de cet investissement, Amazon acquiert une participation minoritaire dans @AnthropicAI. La structure de gouvernance d’Anthropic reste inchangée.
  • L’annonce : https://www.anthropic.com/index/anthropic-amazon.
  • Merci Didier Girard pour ce résumé.

Article d’opinion : les bases de données vectorielles ne sont pas une catégorie de base de donnée séparée https://nextword.substack.com/p/vector-database-is-not-a-separate

  • On a vu l’émergence de nouvelles bases de données de type vectoriel ces deux dernières années : Pinecone, Milvus, Weaviate, Qdrant…
  • Mais les DB existantes sont toutes en train de rajouter le support des vecteurs dans leur moteur.
  • Pour la “data gravity” : c’est plus facile d’avoir ses données au même endroit que d’en avoir dans différentes bases malgré leur corrélation.
  • Pour capturer le use case de “Retrieval Augmented Generation”, en utilisant les Large Language Model pour récupérer de l’info dans ces bases de données vectorielles.
  • Je pense qu’on verra aussi les DB vectorielles ajouter également plus de fonctionnalités de requêtage qui leur manquent.

Chat GPT: voix et image https://openai.com/blog/chatgpt-can-now-see-hear-and-speak

  • OpenAI a annoncé de nouvelles fonctionnalités vocales et d’image pour ChatGPT.
  • OpenAI a publié un article décrivant leurs efforts de test avec GPT-4V. Ils ont utilisé le modèle dans un outil appelé Be My AI, qui aide les personnes malvoyantes en décrivant le contenu des images : https://cdn.openai.com/papers/GPTV_System_Card.pdf.
  • L’article résume l’évaluation du modèle GPT-4V par OpenAI, qui inclut des tests de comportement, de sécurité, et de capacité médicale, mais conclut que le modèle n’est pas approprié pour des fonctions médicales.

L’IA, c’est pas rentable https://www.tomshardware.com/news/microsoft-lost-money-on-ai

  • Copilot dépense 20$ par utilisateur qui ramène 10$.
  • Il va donc y avoir de la rationalisation après l’acquisition rush d’utilisateurs.
  • En augmentant les prix.
  • En mettant des limites plus restrictives.
  • En utilisant des modèles plus simples et plus légers.
  • Peut-être avec du hardware plus optimisé en coût.
  • C’est intéressant que l’IA est déjà trop puissante pour son coût et pas encore assez pour être suffisante. Loi de Moore ?v
  • MS dit que ce chiffre est faux, mais ne donne pas le vrai chiffre.

Outillage

Amazon acquiert Fig https://techcrunch.com/2023/08/29/amazon-fig-command-line-terminal-generative-ai/

  • On en parlait récemment.
  • C’est un terminal boosté à l’IA.

Introduction de TestContainer Desktop https://www.infoq.com/news/2023/09/testcontainers-desktop/

  • Vient de l’appli proprio TestContainer Cloud Desktop.
  • Permet de mettre les ports fixes (plus facile à debugger).
  • Le gel des containers pour laisser le container tourner pour l’inspection
  • Supporte les moteurs de containers alternatifs à Docker (dont Podman et d’autres que je ne connaissais pas).

Nouvelle version 1.7 de jq, l’outil en ligne de commande pour examiner/modifier vos documents JSON https://github.com/jqlang/jq/releases

  • Utilisation des nombres décimaux pour ne pas perdre de précision.
  • Une fonction pick(stream) pour faire des projections et ne garder que les champs qui nous intéressent.
  • Une fonction debug() pour loguer des messages sur stderr.
  • Une fonction abs() pour calculer la valeur absolue.
  • Et plein d’autres petits raffinements et correctifs de bugs.
  • La version d’avant datait de novembre 2018.

Pratiques de Dogfooding : utiliser tes propres outils comme GitHub utilise GitHub actions pour son propre système CI https://www.infoq.com/news/2023/10/running-GitHub-using-actions/

  • Avoir des runners plus larges.
  • Donner l’accès à des resources privées au runner via une gateway qui reçoit un token OIDC specific au runner.
  • Workflow réutilisables.
  • Sortie de workflows réutilisables pour optimiser si le git id est le même qu’un run ancien.

Sondage de la communauté TestContainer https://www.atomicjar.com/2023/09/state-of-local-development-and-testing-2023/

  • TestContainer pour plus de 10 languages, pas juste Java.
  • RDBMS puis message brokers et les bases nosql sont la majorité des usages.
  • Mais pas que (serveur web, émulateur de cloud, microservices internes).
  • 40% des utilisateurs utilisent autre chose que Docker Desktop (docker engine, podman, rancher etc).
  • TestContainer au moment du dev et pas que pour les tests.

Architecture

Vous êtes plutôt logging ou plutôt tracing ? https://andydote.co.uk/2023/09/19/tracing-is-better/

  • L’article essaie de démontrer que le tracing, c’est mieux que le logging.
  • L’imbrication des traces permet de mieux voir la corrélation que des logs.
  • Les traces donnent des informations de durées, pas que des timestamp.
  • On peut rajouter des attributs à ses traces, ce qui rend plus facile le requêtage, plutôt que de faire des greps sur des messages de log.

Méthodologies

On a construit un produit top et ça a échoué Earthly.dev raconte https://earthly.dev/blog/shutting-down-earthly-ci/

  • Outil de CI/CD qui évite de répéter les tâches…
  • Comme startup, tu ne releases pas un produit mature et complet en fonctionnalités.
  • Mais peut-être 10x meilleur sur une chose spécifique qui peut faire oublier les manques à certains.
  • Quand tu captures ces premiers, tu investis et étends, et tu répètes.
  • Si au début ce différenciateur n’attire personne, ajouter des features ne va pas aider, c’est une recette pour construire quelque chose que personne ne veut.
  • Ils ont construit leur plan de domination en étapes indépendantes, des produits plus focalisés.
  • Et le premier produit “gratuit” ne cannibalisait pas les seconds produits, car ils adressaient différents problèmes (donc pas de risque sur le business model).
  • Le premier produit construit par une personne a été beaucoup adopté.
  • Le deuxième (remote workers) a aussi été adopté avec des gens qui faisaient en DIY, et quand ils ont fait une offre managée, les gens sont venus.
  • Les CI traditionnelles lançaient le job et le reste était délégué à Earthly et Earthly Satellites (le cœur du build).
  • Il ne restait plus qu’à allumer le troisième étage Earthly CI, mais c’est parti en cacahuete.
  • La population intéressée n’était pas des fans qui avaient déjà fait le job du produit, ils demandaient en quoi la CI était différente, le coût de migration et ils n’ont jamais pu gagner.
  • Au lieu d’une grass root install, il y avait un long mur de migration à passer.
  • La clé, c’est que vendre aux devs avec un GTM direct ne marche pas, ils doivent essayer et adopter par eux-mêmes.
  • Les développeurs vont acheter un outil de dev, mais tu ne peux pas leur vendre.

horcrux https://github.com/jesseduffield/horcrux

  • Permet de chiffrer un fichier en plusieurs morceaux, et il faut avoir un certain nombre de fragments pour rassembler le fichier entier.
  • Ne nécessite aucun mot de passe.

Sécurité

Des pseudos chercheurs en sécurité utilisent Bard pour reporter un CVE pour le projet cURL https://hackerone.com/reports/2199174

  • Heureusement, Daniel Steinberg (le créateur de cURL) et les mainteneurs du projet ont rapidement détecté la supercherie.
  • Les LLMs sont super créatifs : ils ont déjà vu dans leur corpus d’entrainement des pages de CVE, et sont donc capables d’en imaginer aussi !
  • Mais imaginez le temps perdu par les mainteneurs de projet OSS s’ils doivent du coup perdre leur temps à vérifier de telles inepties ?
  • Au nez et à la Bard de l’IA.

Loi, société et organisation

Cisco achète Splunk pour 28 milliards https://techcrunch.com/2023/09/21/cisco-to-acquire-splunk-in-28b-mega-deal/

  • Bouge cisco plus dans le software.
  • “synergétique”.
  • Objectif : un géant de l’observabilité et la sécurité.
  • Avec de l’IA parce que c’est comme ça qu’on justifie ces achats.
  • Cet achat doit encore être validé par les autorités de concurrence.
  • Quelque part en 2024.

Les fondations comme Eclipse ont peur du Cyber Résilience Act Européen tel que présenté jusqu’à présent https://newsroom.eclipse.org/news/announcements/cra-should-support-open-practices-open-source-and-development-european-open

  • Ils demandent une clarification sur les contraintes réglementaires.
  • Notamment d’exclure les fondations / associations et laisser le poids sur les sociétés qui fourniraient les projets open sources des fondations dans le cadre d’un accord commercial, pas juste de le fournir en téléchargement.
  • Réutiliser la validation de compliance des sociétés commerciales par les fondations.
  • Autre article de la linux foundation : https://www.linuxfoundation.org/blog/understanding-the-cyber-resilience-act.
  • Fourniture de matchs, auditing, fournir des mises à jour.
  • Bouge la responsabilité de l’utilisateur vers le développeur du logiciel.
  • Un individu qui ne reçoit pas de contribution ni ne fait de consulting ⇒ exclu.
  • Fondations et sociétés commerciales ⇒ inclues.
  • Défini des classes de logiciels de non critique à classe 1 et 2.
  • Doit faire un risk assessment avant de livrer (pas de bug de sécurité, secure par défaut, security update).
  • De la doc sur le process d’évaluation des risques et un SBOM notamment.
  • Notifier d’une vulnérabilité en moins de 24h.
  • Il y a une campagne : #FixTheCRA.

Des protestations contre l’ouverture des modèles d’IA de Meta https://spectrum.ieee.org/meta-ai

  • Ouvrir les modèles et leurs poids permet aux acteurs de bypasser les restrictions (biais etc).
  • Donc des gens de Meta protestent contre la politique open source de Meta dans ce domaine.
  • L’argument, c’est qu’un modèle derrière une API peut être éteint.
  • Les partisans de l’avis contraire pointent que contourner les restrictions de ChatGPT a été trivial jusqu’à présent.
  • Et que l’obscurité amène à un déficit de transparence, de connaissance du public.
  • Va affecter les chercheurs indépendants.
  • Cela dit, ce n’est pas de l’open source pur, car les sources et comment le modèle est entrainé est peu publié.
  • L’OSI travaille à une définition d’Open Source AI.

Un site pour mettre une pause à l’IA https://pauseai.info/

  • NOUS RISQUONS DE PERDRE LE CONTRÔLE
  • NOUS RISQUONS L’EXTINCTION DE L’HUMANITÉ
  • NOUS AVONS BESOIN D’UNE PAUSE
  • NOUS DEVONS AGIR IMMÉDIATEMENT
  • Il y a un agenda des manifestations à travers le monde (Londres, Bruxelles, SFO… mais où est Paris ?).
  • Twitter/Discord/Facebook/TikTok/LinkedIn.
  • Alors qui va gagner la course à l’extinction de l’humanité ? La guerre, le réchauffement climatique ou l’IA ?
  • Sarah Connor !!!

Outils de l’épisode

Un QWERTY adapté pour les lettres à accent https://altgr-weur.eu/ (via Thomas Recloux)

Conférences

Toutes les vidéos de Devoxx Belgique sont disponibles sur https://www.youtube.com/@DevoxxForever.

Hacktoberfest, édition 10 https://hacktoberfest.com/.

La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 300 - Interview de Jean-Michel Doudoux sur Java 21 par Charles Sabourdin

Posté le 18/09/2023

Dans cet épisode Charles Sabourdin interview Jean-Michel Doudoux sur la sortie de la nouvelle version LTS de Java en 2023 : Java 21.

Enregistré le 5 septembre 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-300.mp3

Java 21

The art of long-term support and what LTS means for the Java ecosystem

JDK 21

À propos de Jean-Michel Doudoux

À propos de ParisJug

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 299 - Katia est dans la place !

Posté le 11/09/2023

Dans cet épisode de rentrée, Antonio et Arnaud ont le plaisir d’accueillir Katia Aresti dans l’équipe. Ils passent en revue les dernières nouveautés et sujets chauds de cette rentrée, notamment la sortie de Java 21, les nouvelles versions de Quarkus, Micronaut, Hibernate, NodeJS, Redis, et bien d’autres encore. Ils discutent de sujets plus généraux tels que l’observabilité, la nouvelle tendance “Platform Engineering”, et la productivité des développeurs. Ils abordent aussi les sujets sur la sécurité, tels que les failles sur les CPUs Intel et AMD, ainsi que la vie privée, avec les Tracking APIs de Chrome, Firefox et le projet de loi SREN. Le tout est agrémenté de sa dose d’IA, avec des librairies telles que Semantic Kernel, ainsi que des sujets plus haut niveau tels que Google Gemini, Meta GPT, LLama 2, et les biais et la consommation énergétique de l’IA.

Enregistré le 8 septembre 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-299.mp3

News

Langages

Apache Groovy a 20 ans! https://twitter.com/ApacheGroovy/status/1695388098950217909

Java 21 arrive le 19 septembre https://www.infoworld.com/article/3689880/jdk-21-the-new-features-in-java-21.html

  • C’est la nouvelle LTS.
  • Pas mal de nouvelles fonctionnalités comme les virtual threads, le pattern matching sur les switch, sequenced collections…
  • Retrouvez le 19 septembre une interview de Jean-Michel Doudoux par Charles Sabourdin pour l’épisode 300 des Cast Codeurs !

Librairies

Semantic Kernel pour Java est (en train de) sortir : https://devblogs.microsoft.com/semantic-kernel/introducing-semantic-kernel-for-java/

  • Framework OSS pour faire de l’IA.
  • .Net et Python.
  • Java 0.2.7 Alpha est publié.
  • Kernel car il est tout petit.
  • Se connecte à plusieurs fournisseurs (aujourd’hui OpenAI, Azure AI, Hugging Face), plusieurs DB vectorielles, plusieurs templates de prompt (suit la specification de OpenAI).

OpenSSL : qui committe ? https://www.openssl.org/blog/blog/2023/07/17/who-writes-openssl/

  • En majorité des OSS payés.
  • Puis des gens payés par leur boite.
  • Et enfin des contributeurs non payés.
  • c’est rapide, mais ça montre que depuis heartbleed, ça a changé

Micronaut 4.1.0 https://micronaut.io/2023/09/01/micronaut-framework-4-1-0-released/

  • Bean Mappers pour créer automatiquement une correspondance entre un type et un autre.
  • Un Introspection Builder : l’annotation @Introspected pour générer un builder dynamique si un type ne peut être construit que via un modèle builder.
  • Améliorations pour les développeurs utilisant Kotlin Symbol Processing (KSP).

Quarkus 3.3.1 / 3.3.2

Hibernate ORM 6.3.0 et 6.2.8 et Hibernate Reactive 2.0.5 https://hibernate.org/orm/

  • Un support initial de la spécification Jakarta Persistence 3.2.
  • Un nouveau guide d’introduction Hibernate 6, un nouveau guide de syntaxe et de fonctionnalités pour le langage de requête Hibernate (Hibernate Query Language).
  • Annotation @Find sur des méthodes → créer des méthodes de recherche similaires aux méthodes de requête.
  • Reactive compatible avec Hibernate ORM 6.2.8, certains changements d’API.

Infrastructure

Une série d’articles sur l’observabilité par Mathieu Corbin

Web

NodeJS 20.6.0 est disponible et ajoute le support des fichiers .env https://philna.sh/blog/2023/09/05/nodejs-supports-dotenv/

  • Configurable avec l’option --env-file.
  • Le fichier .env peut contenir des variables d’environnement et commentaires #.
  • Attention par contre : pas de lignes multiples ni d’extension de variables.
  • Vous pouvez par exemple configurer NODE_OPTIONS avec ce système.

Data

Redis 7.2 est sorti ! https://redis.com/blog/introducing-redis-7-2/

  • Auto-tiering : cette nouvelle fonctionnalité permet de stocker les données sur des supports de stockage différents, en fonction de leur importance et de leur fréquence d’accès. Cela permet d’améliorer les performances et la scalabilité de Redis.
  • RESP3 : cette nouvelle version du protocole RESP permet une communication plus efficace entre Redis et les clients.
  • Improvements to performance : de nombreuses améliorations de performances ont été apportées à Redis 7.2, notamment pour les opérations de lecture et d’écriture.
  • New commands : plusieurs nouvelles commandes ont été ajoutées à Redis 7.2, notamment :
    • CLIENT NO-TOUCH : cette commande permet d’empêcher un client d’être touché par une opération AOF ou RDB.
    • WAITAOF : cette commande permet d’attendre que l’AOF soit écrite avant de poursuivre l’exécution.
  • Dans le podcast sont cités les hot replacement de Redis, comme Dragonfly.

Architecture

Article sur Google Gemini et sa capacité à battre ChatGPT https://www.semianalysis.com/p/google-gemini-eats-the-world-gemini

  • Google a raté les premiers pas (ils avaient le meilleur LLM public avant ChatGPT 3).
  • Et les chercheurs qui inventent les champs de LLMs.
  • Google va 5x ChatGPT-4 avant la fin de l’année, mais vont-ils les publier ?
  • Les chercheurs se tirent la bourre sur le nombre de GPU (H100) auxquels ils ont accès ; ce sont les grosses organisations comme Meta, OpenAI et Google.
  • Et les autres qui luttent avec des GPUs qui n’ont pas assez de VRAM et ce qu’ils vont faire c’est de la merde et sans consequence.
  • Le peuple utilise le modèle dense de LLAMA mais, pour les environnements contraints, ça serait mieux des sparse models et du speculative decoding.
  • Ils devraient se concentrer sur la performance de modèle qui utilise plus de compute et mémoire en évitant de consommer de la bande passante de memoire, c’est ce dont l’edge computing a besoin.
  • Les benchmarks publics ne mesurent pas des choses utiles.
  • Même HuggingFace est dans la category des GPU-poor.
  • Nvidia est en train de se construire une machine de guerre (service).
  • La Chine et les US vont être en compétition, mais l’Europe qui reste GPU-poor ne va pas s’en sortir.
  • Les startups ne peuvent pas payer les GPUs en action, il faut du cash.
  • Tout le monde rempli les poches de Nvidia, sauf Google.
  • Google grossi exponentiellement ses propres GPUs.

Meta GPT https://www.infoq.com/news/2023/08/metagpt-agent-collaboration/

IA : biais et durabilité par Leslie Miley, tech advisor du CTO de Microsoft https://www.infoq.com/presentations/ai-bias-sustainability

  • Nouvelles infrastructures.
  • La consommation énergétique et d’eau des datacenters pour l’IA est terriblement élevée.
  • L’impact des infrastructures sur les communautés (bruit).
  • Explique bien son point de vue sur les problèmes d’amplification des biais de l’IA.
  • Propose des stratégies pour atténuer l’impact.

Kubeflow, le toolkit pour deployer machine learning (ML) workflow en Kubernetes, est accepté par la CNCF https://www.infoq.com/news/2023/08/kubeflow-cncf-project

Méthodologies

Measuring developer productivity? A response to McKinsey by Kent Beck and Gergely Orosz (pragmaticengineer.com) https://tidyfirst.substack.com/p/measuring-developer-productivity

  • McKinsey a sorti un article où ils expliquent la recette miracle recherchée par tous les managers comme le graal : Comment mesurer la productivité des développeurs ? (faut bien vendre du conseil)
  • Kent et Gergely partent d’un modèle mental de description de la création de valeur par le développeur pour ensuite voir quels sont les besoins de mesurer la productivité et comparent cela avec d’autres secteurs (la vente, le support, le recrutement).
  • Ils concluent cette première partie avec les compromis à faire pour que ce type de mesures ait un intérêt sans impacter trop négativement les développeurs.
  • Un autre article dans la même lignée par Martin Fowler : https://martinfowler.com/bliki/CannotMeasureProductivity.html.

Et si on parlait de Platform Engineering ?

On call Process (Astreinte), startup TinyBird par VP Engineering Félix López (ex google, ex eventbrite) https://thenewstack.io/keeping-the-lights-on-the-on-call-process-that-works/

  • Si votre produit est SAAS, on doit avoir des astreintes. Cela impose un lourd fardeau à ceux qui doivent être en astreinte, surtout en petite entreprise.
  • Petites entreprises évitent avoir un processus d’astreinte formel pour éviter le stress. Cela crée dans la pratique plus de stress : si personne n’est responsable, tout le monde est responsable.
  • Tinybird est la plateforme de données en temps réel pour les développeurs et les équipes de données. Pré-création du process formel chez Tinybird : désorganisé, non structuré et stressant.
  • Mise en place : Principes fondamentaux d’un processus d’astreinte : L’astreinte n’est pas obligatoire, minimiser le bruit, pas seulement pour les SRE, alert = runbook, avoir des backups pour la personne en astreinte, appeler quelqu’un devrait être la dernière solution, minimiser le temps en astreinte.
  • L’article explique comment ils sont passés de regarder chaque alerte (comprehensible ?, exploitable ?), puis avoir un board grafana pour chacune et plan spécifique. Une fois le tri fait, tout migré vers un seul channel de com, et manuel d’astreinte pour chaque alerte. Itérer.
  • Multiples benefices sur le long terme : rapports d’incident ouvert, atténuer les problèmes futurs, renforcement la propriété et les connaissances du code et systèmes au sein de toute l’équipe…

Sécurité

Downfall, une nouvelle faille de sécurité sur les processeurs Intel (https://www.lemondeinformatique.fr/actualites/lire-la-faille-downfall-met-a-mal-des-milliards-de-processeurs-intel-91247.html) et AMD ne fait pas mieux avec une faille nommée Inception (https://www.lemondeinformatique.fr/actualites/lire-les-puces-amd-vulnerables-a-la-faille-inception-91273.html)

  • Downfall, La vulnérabilité est due à des fonctions d’optimisation de la mémoire dans les processeurs Intel qui révèlent involontairement les registres matériels internes aux logiciels. Cela permet à des logiciels non-fiables d’accéder à des données stockées par d’autres programmes, qui ne devraient normalement pas être accessibles. Tous les PC ou ordinateurs portables équipés de processeurs Intel Core de la 6e génération Skylake jusqu’aux puces Tiger Lake de 11e génération incluses contiennent cette faille. Les derniers processeurs Core 12e et 13e génération d’Intel ne sont pas concernés.
  • Inception, nécessite un accès local au système pour être potentiellement exploité ce qui en limite de fait la portée. Tous les processeurs AMD depuis 2017 sont touchés, incluant les derniers modèles Zen 4 Epyc et Ryzen.

Comment désactiver le nouveau tracking publicitaire ciblé sur Chrome https://www.blogdumoderateur.com/chrome-comment-desactiver-tracking-publicitaire-cible/

  • Google a annoncé en juillet le déploiement de sa nouvelle API Topics, permettant « à un navigateur de partager des informations avec des tiers sur les intérêts d’un utilisateur tout en préservant la confidentialité ».
  • C’est cette API, incluse dans la version Chrome 115 de juillet 2023, qui est censée remplacer les cookies tiers.

Loi, société et organisation

Une nouvelle definition d’open pour Llama 2 ? https://opensourceconnections.com/blog/2023/07/19/is-llama-2-open-source-no-and-perhaps-we-need-a-new-definition-of-open/

  • C’est relativement “open” mais il y a des restrictions, donc pas open source.
  • Pas plus de 700 M d’utilisateurs par mois.
  • Pas le droit d’utiliser Llama pour améliorer des autres modèles autres que des dérivés de Llama.
  • Et c’est le modèle final qui est ouvert, pas la sauce pour le construire, donc pas de maven build ni le “source code” pour y arriver “from scratch”.
  • Attention au risque de sacrifier l’open source pour avoir l’IA plus vite, plus facile.

HashiCorp passe tous ses projets open source en BSL, comme Confluent, Mongo, Redis, Elastic… https://thenewstack.io/hashicorp-abandons-open-source-for-business-source-license/

Stack overflow annonce Overflow AI https://www.infoq.com/news/2023/09/stackoverflow-overflowai/

  • L’intégration de l’IA générative dans leur plateforme publique, Stack Overflow for Teams, ainsi que de nouveaux domaines de produits.
  • IA/ML aident à générer des balises initiales et à suggérer des paires question-réponse, permettant aux développeurs de se concentrer sur l’amélioration et la précision.
  • Amélioration des capacités de recherche.
  • Les forums de questions-réponses basés sur la communauté sont le cœur battant de Stack Overflow. Selon Prashanth Chandrasekar, PDG de Stack Overflow, l’objectif d’OverflowAI est d’améliorer la communauté de diverses manières plutôt que de la remplacer complètement.

Vous avez entendu parler du projet de loi SREN ? http://share.mozilla.org/817319645t

  • Le gouvernement français prépare une loi qui pourrait menacer la liberté sur Internet. Le projet de loi visant à sécuriser et réguler l’espace numérique (SREN) obligerait les navigateurs web, comme Mozilla Firefox, à bloquer des sites web directement au niveau du navigateur.
  • Mozilla lance une pétition pour retirer cette énième solution stupide pour censurer Internet.

Conférences

La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 298 - De l'IA à toutes les sauces

Posté le 24/07/2023

Dans cet épisode estival Guillaume, Emmanuel et Arnaud parcourent les nouvelles du début d’été. Du Java, du Rust, du Go du côté des langages, du Micronaut, du Quarkus pour les frameworks, mais aussi du WebGPU, de l’agilité, du DDD, des sondages, de nombreux outils et surtout de l’intelligence artificielle à toutes les sauces (dans les bases de données, dans les voitures…).

Enregistré le 21 juillet 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-298.mp3

News

Langages

La release candidate de Go 1.21 supporte WASM et WASI nativement https://go.dev/blog/go1.21rc

StringBuilder ou concatenation de String https://reneschwietzke.de/java/the-stringbuilder-advise-is-dead-or-isnt-it.html

  • StringBuilder était la recommendation car ça créait moins d’objets notamment.
  • Mais la JVM a évolué et le compilateur ou JIT remplace cela par du code efficace.
  • Quelques petites exceptions.
  • Le code froid (c.-à-d. startup time) qui est encore interprété peut bénéficier de StringBuilder.
  • Autre cas, la concatenation dans des boucles où le JIT ne pourrait peut-être pas optimiser.
  • Le StringBuilder “fluid” est plus efficace (inliné ?).
  • Ces règles ne changent pas si des objets sont stringifié pour être concaténés.

GPT-4 n’est pas une révolution https://thealgorithmicbridge.substack.com/p/gpt-4s-secret-has-been-revealed

  • Rumeurs, car beaucoup de secrets autour de GPT-4
  • Pas un modèle à 1 trillion de paramètres, mais 8 à 220 milliards combinés intelligemment.
  • Les chercheurs attendaient un breakthrough mais c’est une évolution et pas particulièrement nouveau.
  • Méthode déjà implémentée par des chercheurs chez Google (maintenant chez OpenAI).
  • Ils ont retardé la compétition avec ces rumeurs de breakthrough, mais 8 LLaMA peuvent peut-être rivaliser avec GPT-4.

Le blog Open Source de Google propose un article sur 5 mythes ou non sur l’apprentissage et l’utilisation de Rust https://opensource.googleblog.com/2023/06/rust-fact-vs-fiction-5-insights-from-googles-rust-journey-2022.html

  • Il faut plus de 6 mois pour apprendre Rust : plutôt faux ; quelques semaines à 3-4 mois max.
  • Le compilateur Rust n’est pas aussi rapide qu’on le souhaiterait — vrai !
  • Le code unsafe et l’interop sont les plus gros challenges — faux, ce sont plutôt les macros, l’ownership/borrowing et la programmation asynchrone.
  • Rust fournit des messages d’erreur de compilation géniaux — vrai.
  • Le code Rust est de haute qualité — vrai.

InfoQ sort un nouveau guide sur le Pattern Matching pour le switch de Java https://www.infoq.com/articles/pattern-matching-for-switch/

  • Le pattern matching supporte tous les types de référence.
  • L’article parle du cas de la valeur null.
  • L’utilisation des patterns “guarded” avec le mot clé when.
  • L’importance de l’ordre des cases.
  • Le pattern matching peut être utilisé aussi avec le default des switchs
  • Le scope des variables du pattern.
  • Un seul pattern par case label.
  • Un seul case match-all dans un bloc switch.
  • L’exhaustivité de la couverture des types.
  • L’utilisation des generics.
  • La gestion d’erreur avec MatchException.

Librairies

Sortie de Micronaut 4 https://micronaut.io/2023/07/14/micronaut-framework-4-0-0-released/

  • Langage minimal : Java 17, Groovy 4 et Kotlin 1.8.
  • Support de la dernière version de GraalVM.
  • Utilisation des GraalVM Reachability Metadata Repository pour faciliter l’utilisation de Native Image.
  • Gradle 8.
  • Nouvel Expression Language, à la compilation, pas possible au runtime (pour des raisons de sécurité et de support de pré-compilation).
  • Support des Virtual Threads.
  • Nouvelle couche HTTP, éliminant les stack frames réactives quand on n’utilise pas le mode réactif.
  • Support expérimental de IO Uring et HTTP/3.
  • Des filtres basés sur les annotations.
  • Le HTTP Client utilise maintenant le Java HTTP Client.
  • Génération de client et de serveur en Micronaut à partir de fichier OpenAPI.
  • L’utilisation YAML n’utilise plus la dépendance SnakeYAML (qui avait des problèmes de sécurité).
  • Transition vers Jakarta terminé
  • Et plein d’autres mises à jour de modules
  • Couverture par InfoQ https://www.infoq.com/news/2023/07/micronaut-brings-virtual-thread/

Quarkus 3.2 et LTS

Infrastructure

Red Hat partage les sources de sa distribution au travers de son Customer Portal, et impacte la communauté qui se base dessus https://almalinux.org/blog/impact-of-rhel-changes/

  • RedHat a annoncé un autre changement massif qui affecte tous les rebuilds et forks de Red Hat Enterprise Linux.
  • À l’avenir, Red Hat publiera uniquement le code source pour les RHEL RPMs derrière leur portail client.
  • Comme tous les clones de RHEL dépendent des sources publiées, cela perturbe encore une fois l’ensemble de l’écosystème Red Hat.

Une analyse du choix de Red Hat sur la distribution du code source de RHEL https://dissociatedpress.net/2023/06/24/red-hat-and-the-clone-wars/

Une réponse de Red Hat aux feux démarrés par l’annonce de la non-distribution des sources de RHEL en public https://www.redhat.com/en/blog/red-hats-commitment-open-source-response-gitcentosorg-changes

Et un lien vers un de ces feux d’une personne proéminente dans la communauté Ansible https://www.jeffgeerling.com/blog/2023/im-done-red-hat-enterprise-linux

Oracle demande à garder un Linux ouvert et gratuit https://www.oracle.com/news/announcement/blog/keep-linux-open-and-free-2023-07-10/

  • Suite à l’annonce d’IBM/RedHat, Oracle demande à garder Linux ouvert et gratuit.
  • IBM ne veut pas publier le code de RHEL car elle doit payer ses ingénieurs.
  • Alors que RedHat a pu maintenir son modèle économique durant des années.
  • L’article revient sur CentOS qu’IBM “a tué” en 2020.
  • Oracle continu ses efforts de rendre Linux ouvert et libre.
  • Oracle Linux continuera à être compatible avec RHEL jusqu’à la version 9.2. Après, ça sera compliqué de maintenir une compatibilité.
  • Oracle embauche des devs Linux.
  • Oracle demande à IBM de récupérer le downstream d’Oracle et de le distribuer.

SUSE forke RHEL https://www.suse.com/news/SUSE-Preserves-Choice-in-Enterprise-Linux/

  • SUSE est la société derrière Rancher, NeuVector, et SUSE Linux Enterprise (SLE).
  • Annonce un fork de RHEL.
  • $10M d’investissement dans le projet sur les prochaines années.
  • Compatibilité assurée de RHEL et CentOS.

Web

Google revend son service de nom de domaine à Squarespace https://www.reddit.com/r/webdev/comments/14agag3/squarespace_acquires_google_domains/

  • et ça n’était pas gratuit, donc on n’est pas censé être le produit 😉
  • Squarespace est une entreprise américaine spécialisée dans la création de sites internet.
  • Squarespace est un revendeur de Google Workspace depuis longtemps.
  • La vente devrait se finaliser en Q3 2023.

Petite introduction à WebGPU en français https://blog.octo.com/connaissez-vous-webgpu/

Data

Avec la mode des Large Language Models, on parle de plus en plus de bases de données vectorielles, pour stocker des “embeddings” (des vecteurs de nombre flottant représentant sémantiquement du texte, ou même des images). Un article explique que les Vecteurs sont le nouveau JSON dans les bases relationnelles comme PostgreSQL https://jkatz05.com/post/postgres/vectors-json-postgresql/

Outillage

Le sondage de StackOverflow 2023 https://survey.stackoverflow.co/2023/

  • L’enquête a été réalisée auprès de 90 000 développeurs dans 185 pays.
  • Les développeurs sont plus nombreux (+2%) que l’an dernier à travailler sur site (16% sur site, 41% remote, 42% hybrid).
  • Les développeurs sont également de plus en plus nombreux à utiliser des outils d’intelligence artificielle, avec 70 % d’entre eux déclarant les utiliser (44%) ou prévoyant de les utiliser (25) dans leur travail.
  • Les langages de programmation les plus populaires sont toujours JavaScript, Python et HTML/CSS.
  • Les frameworks web les plus populaires sont Node, React, JQuery.
  • Les bases de données les plus populaires sont PostgreSQL, MySQL, et SQLite.
  • Les systèmes d’exploitation les plus populaires sont Windows puis macOS et Linux.
  • Les IDE les plus populaires sont Visual Studio Code, Visual Studio et IDEA IntelliJ.

Les différents types de déplacement dans Vim https://www.barbarianmeetscoding.com/boost-your-coding-fu-with-vscode-and-vim/moving-blazingly-fast-with-the-core-vim-motions/

JetBrains se met aussi à la mode des assistants IA dans l’IDE https://blog.jetbrains.com/idea/2023/06/ai-assistant-in-jetbrains-ides/

  • Une intégration avec OpenAI, mais aussi de plus petits LLMs spécifiques à JetBrains.
  • Un chat intégré pour discuter avec l’assistant, puis la possibilité d’intégrer les snippets de code là où se trouve le curseur.
  • Possibilité de sélectionner du code et de demander à l’assistant d’expliquer ce que ce bout de code fait, mais aussi de suggérer un refactoring, ou de régler les problèmes potentiels.
  • On peut demander à générer la JavaDoc d’une méthode, d’une classe, etc, ou à suggérer un nom de méthode (en fonction de son contenu).
  • Génération de message de commit.
  • Il faut avoir un compte JetBrains AI pour y avoir accès.

Des commandes macOS plus ou moins connues https://saurabhs.org/advanced-macos-commands

  • caffeinate — pour garder le mac éveillé,
  • pbcopy / pbpaste — pour interagir avec le clipboard,
  • networkQuality — pour mesurer la rapidité de l’accès à internet,
  • sips — pour manipuler / redimensionner des images,
  • textutil — pour convertir des fichiers Word, texte, HTML,
  • screencapture — pour faire un screenshot,
  • say — pour donner une voix à vos commandes.

Le sondage de la communauté ArgoCD https://blog.argoproj.io/cncf-argo-cd-rollouts-2023-user-survey-results-514aa21c21df

Un client d’API open-source et cross platform pour GraphQL, REST, WebSockets, Server-sent events et gRPC https://github.com/Kong/insomnia

Architecture

Moderniser l’architecture avec la découverte via le domain driven discovery https://www.infoq.com/articles/architecture-modernization-domain-driven-discovery/

  • Un article très détaillé pour moderniser son architecture en utilisant une approche Domain-Driven Discovery qui se fait en 4 étapes : 1- Encadrer le problème – Clarifier le problème que vous résolvez, les personnes touchées, les résultats souhaités et les contraintes de solution. 2- Analyser l’état actuel – Explorer les processus opérationnels et l’architecture des systèmes existants afin d’établir une base de référence pour l’amélioration. 3- Explorer l’état futur – Concevoir une architecture modernisée fondée sur des contextes délimités, établir des priorités stratégiques, évaluer les options et créer des solutions pour l’état futur. 4- Créer une feuille de route – Créer un plan pour moderniser l’architecture au fil du temps en fonction des flux de travail ou des résultats souhaités.

Récemment, Sfeir a lancé son blog de développement sur https://www.sfeir.dev/

  • Plein d’articles techniques sur de nombreux thèmes : front, back, cloud, data, AI/ML, mobile.
  • Aussi des tendances, des success stories…
  • Par exemple dans les derniers articles : on parle d’Alan Turing, du Local Storage en Javascript, de la préparation de certifications React, l’impact de la cybersécurité sur le cloud.

Demis Hassabis annonce travailler sur une IA nommée Gemini qui dépassera ChatGPT https://www.wired.com/story/google-deepmind-demis-hassabis-chatgpt/

  • Demis Hassabis CEO de Google DeepMind créateur de AlphaGO et AlphaFold.
  • Travaille sur une IA nommée Gemini qui dépasserait ChatGPT de OpenAI.
  • Similaire à GPT-4, mais avec des techniques issues de AlphaGO.
  • Encore en développement, va prendre encore plusieurs mois.
  • Un remplaçant à Bard ?

Méthodologies

Approcher l’agilité par les traumatismes (de développement) passés des individus https://www.infoq.com/articles/trauma-informed-agile/?utm_campaign=infoq_content&utm_source=twitter&utm_medium=feed&utm_term=culture-methods

  • Nous subissons tous un traumatisme du développement qui rend difficile la collaboration avec d’autres - une partie cruciale du travail dans le développement de logiciels agiles.
  • Diriger d’une manière tenant compte des traumatismes, ça n’est pas pratiquer la psychothérapie non sollicitée, et ça ne justifie pas les comportements destructeurs sans les aborder.
  • Être plus sensible aux traumatismes dans votre leadership peut aider tout le monde à agir de façon plus mature et plus disponible sur le plan cognitif, surtout dans des situations émotionnellement difficiles.
  • Dans les milieux de travail tenant compte des traumatismes, les gens accordent plus d’attention à leur état physique et émotionnel.
  • Ils s’appuient aussi davantage sur le pouvoir de l’intention, fixent des objectifs d’une manière moins manipulatrice et sont capables d’être empathiques sans s’approprier les problèmes des autres.

Loi, société et organisation

Mercedes va rajouter de l’intelligence artificielle dans ses voitures https://azure.microsoft.com/en-us/blog/mercedes-benz-enhances-drivers-experience-with-azure-openai-service/

  • Programme beta-test de 3 mois pour le moment.
  • Assistance vocale “Hey Mercedes”.
  • Permet de discuter avec la voiture pour trouver son chemin, concocter une recette, ou avoir tout simplement des discussions.
  • Ils travaillent sur des plugins pour réserver un resto, acheter des tickets de cinéma.

Free software vs Open Source dans le contexte de l’intelligence artificielle par Sacha Labourey https://medium.com/@sachalabourey/ai-free-software-is-essential-to-save-humanity-86b08c3d4777

  • On parle beaucoup d’IA et d’open source.
  • Mais il manque la dimension de contrôle des utilisateurs finaux.
  • Stallman a créé la FSF par peur de la notion d’humain augmenté par des logiciels qui sont contrôlés par d’autres (implants dans le cerveau etc).
  • D’où la GPL et sa viralité qui propage la capacité à voir et modifier le code que l’on fait tourner.
  • Dans le débat IA, ce n’est pas seulement Open Source (casser l’oligopolie) mais aussi le Free Software qui est en jeu.

La folie du Cyber Resilience Act (CRA) européen https://news.apache.org/foundation/entry/save-open-source-the-impending-tragedy-of-the-cyber-resilience-act

  • Au sein de l’UE, la loi sur la cyber-résilience (CRA) fait maintenant son chemin à travers les processus législatifs (et doit faire l’objet d’un vote clé le 19 juillet 2023). Cette loi s’appliquera à un large éventail de logiciels (et de matériel avec logiciel intégré) dans l’UE. L’intention de ce règlement est bonne (et sans doute attendue depuis longtemps) : rendre le logiciel beaucoup plus sûr.
  • Le CRA a une approche binaire : oui/non et considère tout le monde de la même manière.
  • Le CRA réglementerait les projets à source ouverte à moins qu’ils n’aient « un modèle de développement entièrement décentralisé ». Mais les modèles OSS sont de complexes mélanges de pur OSS et éditeurs de logiciels.
  • les entreprises commerciales et les projets open source devront être beaucoup plus prudents quant à ce que les participants peuvent travailler sur le code, quel financement ils prennent, et quels correctifs ils peuvent accepter.
  • Certaines des obligations sont pratiquement impossibles à respecter, par exemple l’obligation de « livrer un produit sans vulnérabilités exploitables connues ».
  • Le CRA exige la divulgation de vulnérabilités graves non corrigées et exploitées à l’ENISA (une institution de l’UE) dans un délai mesuré en heures, avant qu’elles ne soient corrigées (complètement opposé aux bonnes pratiques de sécu).
  • Une fois de plus une bonne idée à l’origine, mais très mal implémentée qui risque de faire beaucoup de dommages.

Octave Klaba, avec Miro, son frère, et la Caisse des Dépôts, finalisent la création de Synfonium qui va maintenant racheter 100% de Qwant et 100% de Shadow. Synfonium est détenue à 75% par Jezby Venture et Deep Code et à 25% par la CDC. https://twitter.com/i/web/status/1673555414938427392

  • L’un des rôles de Synfonium est de créer la masse critique des utilisateurs et des clients B2C et B2B qui vont pouvoir utiliser tous ces services gratuits et payants.
  • Vous y retrouverez le moteur de recherche, les services gratuits, la suite collaborative, le social login, mais aussi les services de nos partenaires tech.
  • Le but est de créer une plateforme dans le Cloud SaaS EU qui respecte nos valeurs et nos lois européennes.

Yann LeCun : « L’intelligence artificielle va amplifier l’intelligence humaine » https://www.europe1.fr/emissions/linterview-politique-dimitri-pavlenko/yann-lecun-lintelligence-artificielle-va-amplifier-lintelligence-humaine-4189120

Conférences

La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 297 - Lockless design

Posté le 12/06/2023

Guillaume, Arnaud et Emmanuel discutent des nouvelles de mai et juin. La communauté Rust, WebAssembly. Guava, Debezium, Kafka, de flame graph, d’open source et bien sûr les large language models. On répond aussi à la question fondamentale : mais pourquoi Maven n’a pas de fichier .lock ?

Enregistré le 9 juin 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-297.mp3

News

Langages

Lors de Microsoft BUILD 2023, un des fondateurs de OpenAI a fait une excellente présentation de Large Language Models, des GPT https://build.microsoft.com/en-US/sessions/db3f4859-cd30-4445-a0cd-553c3304f8e2

  • Il parle du fonctionnement des LLM, comment/pourquoi ils arrivent à générer ce qu’ils génèrent.
  • Le fine-tuning, l’apprentissage renforcé avec feedback humain, l’art du prompting.
  • Des patterns comme Chain of Thought (CoT) ou ReAct (Reflect then Act).

Leaning Technologies annonce l’arrivée prochaine de CheerpJ 3 : le retour de Java dans le navigateur, grâce à WebAssembly https://leaningtech.com/announcing-cheerpj-3-0-a-jvm-replacement-in-html5-and-webassembly-to-run-java-applications-and-applets-on-modern-browsers/

  • Avant la version 3.0, CheerpJ utilisait une approche AOT (Ahead Of Time compilation) qui nécessitait aussi une étape d’intégration continue pour transformer aussi toutes les dépendances JAR associées à un projet.
  • Avec la version 3.0, qui devrait sortir cet été, CheerpJ adopte une approche JIT (Just-In-Time compilation) qui ressemble plus à l’approche de Java lui-même.
  • Plus besoin non plus de version custom d’OpenJDK.
  • Les Applets vous avaient manqué ? Elles sont de retour avec WebAssembly 😀.

Communauté RUST : Il y a de l’eau dans le gaz https://www.jntrnr.com/why-i-left-rust/

  • Plus d’infos sur https://gist.github.com/fasterthanlime/42da9378768aebef662dd26dddf04849.
  • Lié au backchannel et un petit groupe qui essaie de faire les choses bien, mais qui dérape de l’extérieur.
  • En gros, ils ont un process interne pour prendre des décisions.
  • Avec ce process, ils ont invité une personne pas super pro-Rust à faire la keynote à RustConf.
  • D’autres membres du commité ont vu ça et ont discuté en backchannel pour annuler la décision (sans suivre le process).
  • Il y a eu une semaine de pause avant action, mais pas d’annonce.
  • Le speaker a été dékeynoté et a donc refusé de venir à la conférence.
  • Et paf ! Ça énerve des gens décisionnaire et ils démissionnent.
  • Bref des gens qui veulent faire bien, mais en cercle un peu trop fermé.

Les gens de Wasmer étendent WASI avec WASIX, en rajoutant le support POSIX, les threads… permettant de compiler vers WASM plein de projet C/C++ ou Rust, comme cURL https://wasmer.io/posts/announcing-wasix

  • Ça frotte un peu entre innovation et standardisation dans la communauté WASM.
  • WASMER sont un peu les cowboys startuper.
  • Par exemple, ils ont essayé de déposer la marque WebAssembly au nez et à la barbe de la communauté.
  • Donc la reaction du cœur de la communauté face à cette annonce est plutôt calme.
  • WASI c’est standard, mais ça prend du temps à maturer.
  • WASIX c’est cool et disponible maintenant, mais c’est un produit d’une société spécifique, donc pas de portabilité.

Librairies

Guava 32 est sorti et beaucoup de choses annotées en @Beta ne le sont plus https://www.reddit.com/r/java/comments/13w2l8w/guava_320_released_today_and_the_beta_annotation/

  • Ils ont eu des API en @Beta pendant longtemps pour protéger des risques de changements.
  • En pratique quasi personne ne se limitait au non-beta, et ces API n’ont pas ou peu bougé.
  • Ils ont donc enlevé @Beta de la plupart des API.
  • Beaucoup de parties de Guava sont dans le JDK, le cache est dans Caffeine.
  • De bons échanges dans les commentaires entre les utilisateurs et Kevin, un des mainteneurs chez Google

Comment démarrer avec l’API PaLM de Google, mais en Java ! https://glaforge.dev/posts/2023/05/30/getting-started-with-the-palm-api-in-the-java-ecosystem/

Infrastructure

Debezium 2.2 https://debezium.io/blog/2023/04/20/debezium-2-2-final-released/

  • Experimental opt-in Parallel Snapshots,
  • Incremental snapshots with surrogate keys,
  • Quarkus 3 support,
  • Ingestion of Oracle changes from logical standby instances,
  • Google Spanner improvements,
  • New Debezium Server sinks for Infinispan, RabbitMQ, and RocketMQ,
  • New Storage APIs for Amazon S3 and RocketMQ,
  • Many MongoDB improvements,
  • Cassandra connector for Cassandra Enterprise.

Un article sur l’utilisation de Kafka par CloudFlare https://www.infoq.com/articles/kafka-clusters-cloudflare/

  • C’est du “classique”, mais bon de se le faire rappeler.
  • Beaucoup d’évènements CloudFlare ne passent pas Kafka pour processing.
  • Kafka en tant que bus générique.
  • Ils ont imposé un message unique par topic via Protobuf.
  • Ils ont une Application Service team (internal developer platform) depuis peu de temps.
  • GitOps pour création de topic…
  • Ils ont développé un connector framework déclaratif pour étendre le panel de patrons d’architecture disponibles.
  • Ils ont développé des SDKs d’accès à Kafka avec monitoring (Prometheus).
  • Sympa à lire.

Post mortem du problème chez Datadog https://www.datadoghq.com/blog/2023-03-08-multiregion-infrastructure-connectivity-issue/

  • Datadog a perdu tous ses services dans la plupart de ses regions pendant 3 heures avant la première récupération et 10 heures au total pour la récupération totale.
  • Équipe : 10 senior engineering leaders, about 70 local incident commanders and a pool of 450 to 750 incident responders active throughout the incident, which required four shifts to bring the incident to full resolution.
  • Cause : une mise à jour de systemd appliquée sur la plupart de leurs VM en quasi parallèle qui a effacé les routes des conteneurs et ne les a pas remis ; c’est un cas qui n’arrive pas au reboot d’un nœud (init sequence).
  • Des dizaines de milliers de nœuds ont été impactés.
  • En général, ils font du rollout par région en enlevant les nœuds etc, mais le base OS avait un legacy update channel activé (vs géré par les équipes de Datadog manuellement).
  • Les nœuds de controllers qui sont censés recycler les nœuds n’ont pu le faire vu le nombre de nœuds et surtout parce qu’eux-mêmes étaient affectés.
  • L’autre article.

Cloud

Le datacenter parisien europe-west9-a est en panne depuis 3 semaines https://www.lebigdata.fr/data-center-panne

  • Un feu s’est déclenché et a touché une zone.
  • Le datacenter reste opérationnel sur les zones non touchées, sauf BigTable qui a besoin de la zone touchée.
  • Les autres services fonctionnent, sauf les applis utilisateurs qui ne tournaient que sur la zone affectée.

Outillage

Podman Desktop 1.0 est sorti https://podman-desktop.io/blog/podman-desktop-release-1.0

  • Pas grand-chose d’autre à dire que c’est la 1.0.
  • “Works on my machine”

Contract testing with Pact https://hollycummins.com/contract-testing-devoxx-greece/

  • Conférence.
  • Quand on change un microservice l’autre casse.
  • Les tests d’integration sont lents, instables et demandent de grosses machines ou des environnements remote de dev.
  • Mock / unit tests ne sont pas vraiment le code de l’autre équipe.
  • D’où les contract tests qui vivent entre les tests end to end et les tests unitaires.
  • Peut partir d’un test mock et remplacer avec pact côté consommateur.
  • En faisant tourner un pact listener qui enregistre la déclaration et les retours attendus / générés par l’appel du test.
  • Copier ce fichier vers le producteur.
  • Copier à la main, dans le repo, via un broker.
  • Ajoute un test pact côté producteur qui va exercer le JSON et vérifier que cela marche.
  • Tests de pact sont plus profonds qu’un test OpenAPI.
  • Consommateur utilise pact comme mock et vérifie le provider avec le contract du mock.

Pourquoi Maven n’a pas de fichier lock ? https://www.reddit.com/r/Maven/comments/vkcmys/why_maven_doesnt_have_a_lock_file_like/

  • Conversation intéressante sur les fichiers .lock dans les builds.
  • Par exemple Ruby a le Gemfile.lock, npm pareil, mais pas Java ?
  • Fondamentalement, c’est dû aux valeurs par défaut initiales et à la culture de la communauté.
  • Les versions range sont peu ou pas utilisés en Maven.
  • Alors que c’est l’approche par défaut sur d’autres plateformes
  • La poule et l’œuf.

Simplifier les flame graph avec JBang https://someth2say.wordpress.com/2023/06/04/jbang-and-flame-graphs/

  • Discute des flame graph.
  • Pour le temps consommé et pas un call graph.
  • En hauteur, c’est la profondeur d’appel.
  • Ne regarder que la largeur, pas l’ordre.
  • Pas quand et où une action est faite, mais qui l’a faite.
  • Le reste discute de la manière d’utiliser JBang pour lancer le programme et le javaagent.

Les modérateurs de Stack Overflow en grève contre le flux de réponses d’intelligence artificielle https://openletter.mousetail.nl/

  • Le ban des contenus générés par l’IA a été levé discrètement par Stack Overflow.
  • Peur du flux de données massif et des hallucinations difficiles à détecter sans passer du temps.
  • Pas de consensus communautaire.
  • Stack Overflow est une des sources trustées pour les LLM des intelligences artificielles génératives (serpent qui se mord la queue).
  • Les modérateurs font tourner l’anti-spam, gèrent les flags levés, ferment ou effacent les entrées, genre les bots qui détectent le plagiat…
  • 414 votants dès les premières heures.

Just, un petit outil en ligne de commande avec une syntaxe inspirée de make, pour exécuter des commandes fréquentes dans nos projets https://glaforge.dev/posts/2023/06/07/just-a-handy-command-line-tool/

  • Syntaxe proche de celle de make.
  • Possibilité de définir des dépendances entre tâches.
  • Support de paramètres.
  • Peut charger des fichier .env.
  • S’installe sur tous les systèmes d’exploitation qu’on aime bien (et qu’on n’aime pas aussi).

Méthodologies

AWS retire ses documentations en Open Source https://www.infoq.com/news/2023/06/aws-documentation-github/

  • Ils ont open-sourcé en espérant des contributions il y a deux ans, mais sans changer les approches en interne.
  • Résultat : copie de repos de l’intérieur vers l’extérieur.
  • Tracker de travail interne != externe.
  • C’était plus compliqué.
  • Leçon, embrasser entièrement sinon les frictions sont compliquées.

Un guide pour communiquer avec l’IA https://learnprompting.org/

  • Gratuit et open source.
  • Prompt Engineering ou comment rédiger vos prompts.
  • Plusieurs niveaux (Basic, Intermédiaire, Avancé..).
  • Défini plein de concepts: Prompt, Few Shot Prompt, LLMs…

Loi, société et organisation

Migration de Twitter vers Mastodon (ou plutôt “dual run”) https://glaforge.dev/talks/2023/06/09/from-bird-to-elephant-starting-a-new-journey-on-mastodon/

Conférences

Aurelie Vache publie son agenda des conferences via le site: https://developers.events/

La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 296 - Interview Google IA IA I/O 2023

Posté le 25/05/2023

Dans cet épisode, Antonio, Emmanuel et Guillaume reviennent sur les nouveautés et annonces faites à Google I/O 2023 : de nouveaux téléphones Pixel qui se plient ou pas, et surtout de l’intelligence artificielle du sol au plafond ! Que ce soit dans Android, dans Google Workspace, dans Google Cloud, une tonne de produits passe en mode survitaminé à l’IA. Guillaume, Antonio et Emmanuel discutent aussi de l’impact qu’ils voient sur l’AI, et de comment les Large Language Models sont raffinés et pourquoi on les fait halluciner, de subtilités du langage des signes.

Enregistré le 23 mai 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-296.mp3

Google I/O 2023

Site web : https://io.google/2023/

Keynote principale : https://io.google/2023/program/396cd2d5-9fe1-4725-a3dc-c01bb2e2f38a/

Keynote développeur : https://io.google/2023/program/9fe491dd-cadc-4e03-b084-f75e695993ea/

Vidéo résumée en 10 minutes de toutes les annonces : https://www.youtube.com/watch?v=QpBTM0GO6xI&list=TLGGCy91ScdjTPYxNjA1MjAyMw

Vidéo de toutes les sessions techniques : https://io.google/2023/program/?q=technical-session

Google I/O s’est tenu il y a 10 jours en Californie, dans l’amphithéâtre de Shoreline, près du campus de Google.

Seulement 2000 personnes sur place, un chat et un jeu en ligne pour assister à distance.

Jeu en ligne I/O Flip créé avec Flutter, Dart, Firebase, et Cloud Run, et tous les assets graphiques générés par Generative AI https://blog.google/technology/ai/google-card-game-io-flip-ai/

Des Pixels plein les yeux !

Des détails sur le design des nouveaux appareils : https://blog.google/products/pixel/google-pixel-fold-tablet-7a-design/

Pixel Fold

Article : https://blog.google/products/pixel/google-pixel-fold/

  • Premier téléphone foldable de Google (après Samsung et Oppo)
  • Un écran sur le dessus, et un grand écran pliable à l’intérieur
    • Pratique pour la traduction où peut voir une discussion traduire en deux langues d’un côté sur un écran et dans l’autre langue sur l’autre
  • Utilisation créative de la pliure : mode “laptop”, pour les selfies, pour poser l’appareil pour des photos de nuit
  • Par contre… pas disponible en France, et tout de même presque 1900€ !

Pixel Tablet

Article : https://blog.google/products/pixel/google-pixel-tablet/

  • Une belle tablette de 11 pouces, avec un dock de recharge avec enceinte intégrée
  • Processeur Tensor G2, Chromecast intégré
  • C’est un peu comme le Google Nest Hub Max, mais avec un écran détachable
  • Une coque pratique avec un trépied intégré et qui n’empêche pas de recharger la tablette sur le dock
  • En mode dock, c’est comme l’écran du Google Home App, et dès qu’on la décroche, on est en mode multi-utilisateur, chacun avec son profil

Pixel 7a

Article : https://blog.google/products/pixel/pixel-7a-io-2023/

  • Écran de 6 pouces
  • Triple appareil photo (grand angle, principal, et photo avant pour les selfies)
  • 509 euros
  • Magic Eraser pour effacer les trucs qu’on ne veut pas dans la photo, Magic Unblur pour rendre une photo floue plus nette, Real Tone pour rendre les peaux foncées plus naturelles

Android

Article quoi de neuf dans Android : https://blog.google/products/android/android-updates-io-2023/

Google Maps

Article : https://blog.google/products/maps/google-maps-updates-io-2023/

  • Maps propose 20 milliards de km de direction tous les jours
  • Immersive View for Routes
  • 15 villes : Amsterdam, Berlin, Dublin, Florence, Las Vegas, London, Los Angeles, Miami, New York, Paris, San Francisco, San Jose, Seattle, Tokyo et Venice
  • Possibilité pour les développeurs de s’intégrer et rajouter des augmentations 3D, des marqueurs

Google Photos

Article Magic Editor : https://blog.google/products/photos/google-photos-magic-editor-pixel-io-2023/

  • Magic Editor survitaminé à l’IA pour améliorer les photos, en déplaçant des gens, en rajoutant des parties coupées, ou bien rendre le ciel plus beau
  • Possible que ce soit limité aux téléphones Pixel au début

Projets expérimentaux

Search Labs

Article : https://blog.google/products/search/generative-ai-search/

  • Expérimentations pour rajouter l’IA générative dans Google Search
  • Faire des recherches avec des requêtes avec des phrases plus complexes, en intégrant des réponses comme Bard, avec des liens, des suggestions d’autres recherches associées
  • Mais aussi proposer des publicités mieux ciblées
  • On peut s’inscrire à Search Labs pour tester cette nouvelle expérience, mais au début juste en anglais et juste pour les US
  • Des intégrations avec Google Shopping pour proposer et filtrer des produits qui correspondent à la requête
  • Recherche à l’aide d’image, avec Google Lens : 12 milliards de recherches visuelles par mois

Palm et Bard

  • Annonce du modèle LLM Palm 2 utilisé dans Bard et dans Google Cloud https://blog.google/technology/ai/google-palm-2-ai-large-language-model/
  • PaLM 2 est en cours d’intégration dans 25 produits de Google
  • Supportera 100 langues différentes (pour l’instant seulement l’anglais, japonais et coréen), avec déjà les 40 langues les plus parlées d’ici à la fin de l’année
  • Maintenant disponible dans 180 pays… sauf l’Europe !!!
  • Capacité de raisonnement accrue
  • Peut coder dans une vingtaine de langages de programmation différents dont Groovy
  • Différentes tailles de modèles : Gecko, Otter, Bison et Unicorn, mais le nombre de paramètres n’est pas communiquée, comme pour GPT-4 d’OpenAI
  • Utilisable pour des requêtes et pour du chat
  • Des modèles dérivées fine-tunés Med-PaLM 2 sur du savoir médical, sur l’analyse visuelle des radios et Sec-PaLM, entrainé sur des cas d’utilisation sur le thème de la cybersécurité, pour aider à déceler des scripts malicieux, des vecteurs d’attaque
  • Sundar Pichai a aussi annoncé que Google travaillait déjà sur la prochaine évolution de ses LLM avec un modèle appelé Gemini. Peu de détails à part qu’il sera multimodal (en particulier recherche combinée image et texte par ex.)
  • Partenariat et intégration d’Adobe Firefly dans Bard pour générer des images https://blog.adobe.com/en/publish/2023/05/10/adobe-firefly-adobe-express-google-bard

Duet AI pour Google Workspace

Article : https://workspace.google.com/blog/product-announcements/duet-ai

  • Dans Gmails et Docs, propose d’aider à la rédaction de vos emails et documents
    • une extension de “smart compose” qui va permettre de générer des emails entiers, d’améliorer le style, de corriger la grammaire, éviter les répétitions de texte
  • Dans Docs, des nouveaux “smart chips” pour rajouter des variables, des templates
  • Dans Slides, rajouter des images générées par IA
  • Des prompts dans Sheets pour générer un draft de table
  • Dans Google Meet, possibilité de créer une image de fond customisée avec Generative AI
  • Ces améliorations font parties de Workspace Labs auquel on peut s’inscrire dans la liste d’attente https://workspace.google.com/labs-sign-up/

Google Cloud

Intégration de Generative AI partout https://cloud.google.com/blog/products/ai-machine-learning/google-cloud-launches-new-ai-models-opens-generative-ai-studio

  • Nouvelles VM A3 avec les GPUs H100 de Nvidia, idéal pour l’entrainement de modèles de machine learning, avec 26 exaFlops de performance https://cloud.google.com/blog/products/compute/introducing-a3-supercomputers-with-nvidia-h100-gpus
  • Trois nouveaux modèles LLM dans Vertex AI : Imagen (private preview) pour générer des images, Codey pour la génération de code, et Chirp pour la génération de la parole supportant 100 langues différentes avec 2 milliards de paramètres vocaux
  • Model Garden : avec les modèles de machine learning y compris externes et open sources
  • Ajout des embeddings pour le texte et l’image
  • RLHF, Reinforcement Learning from Human Feedback bientôt intégrer pour étendre Vertex AI tuning et prompt design avec une boucle de feedback humaine
  • Generative AI Studio pour tester ses prompts zero-shot, one-shot, multi-shots
  • Duet AI pour Google Cloud https://cloud.google.com/blog/products/application-modernization/introducing-duet-ai-for-google-cloud
  • Assistance de code dans VSCode et bientôt les IDEs JetBrains grâce au plugin Cloud Code, et dans Cloud Workstations.
  • Intégration dans les IDEs d’un chat pour comme un compagnon pour discuter d’architecture, trouver les commandes à lancer pour son projet
  • Le modèle de code de Codey fonctionne sur une vingtaine de languages de programmation, mais un modèle fine-tuné a été entrainé sur toute la doc de Google Cloud, donc pourra aider en particulier sur l’utilisation des APIs de Google Cloud, ou l’utilisation de la ligne de commande gcloud
  • Duet AI est aussi dans App Sheet, la plateforme low/no-code, et permettra de chatter avec un chatbot pour générer une application App Sheet
  • Quoi de neuf dans Firebase https://firebase.blog/posts/2023/05/whats-new-at-google-io

Web

Article : https://developers.googleblog.com/2023/05/io23-developer-keynote-recap.html

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 295 - La librairie rentre dans le cadre

Posté le 15/05/2023

Dans cet épisode, Arnaud, Antonio et Emmanuel décortiquent les nouvelles d’avril et mai. On y discute Java 20, écrire un profiler de zéro, Quarkus 3 (encore !), Micronaut 4, Podman, JReleaser, GitHub, CloudEvent, GraphQL, licenciements (encore !), et de la question a 1000 francs : librairie vs framework, quelle différence ? Mais pas que.

Enregistré le 12 mai 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-295.mp3

News

Langages

Un descriptif du changement de tarification d’Oracle JDK https://horstmann.com/unblog/2023-02-23/

  • Article de Cay S. Horstmann.
  • Explique OpenJDK avec plusieurs distributeurs.
  • Préfère Adoptium, dont celle par défaut est Eclipse Temurin.
  • Pour Oracle, beaucoup d’options de licenses (no-fee, binary code, OTM license).
  • Oracle dépense beaucoup pour Java.
  • La license en discussion est Java SE Universal Subscription Licensing.
  • Passage de license par CPU (Java SE advanced) vers license par employé (et une assiette large).
  • Bref si vous êtes concernés, passez sur OpenJDK : Adoptium, ou d’autres vendeurs.

Java 20 est sorti : qu’y a-t-il de nouveau dans Java 20 par rapport à Java 19 ? https://foojay.io/today/its-java-20-release-day-heres-whats-new/

  • L’article fait le point sur ce qu’il y a de nouveau par rapport à la précédente release :
    • 4ème preview du pattern matching pour switch,
    • 2de preview des record patterns,
    • 2de preview des virtual threads,
    • incubation des scoped values (similaire au thread locals mais pour les virtual threads),
    • 2de incubation de la structured concurrency,
    • 2de preview de foreign function et memory API,
    • 5ème incubation de la vector API (pour utiliser les instructions vectorielles des processeurs).
  • La liste des JEPs : https://openjdk.org/projects/jdk/20/.
  • Les release notes : https://jdk.java.net/20/release-notes.
  • Dans le pattern matching switch: guard when .
  • Record pattern : var maintenant aussi utilisable dans les for : for (Delay(var timeInMS) : delays)
  • Quelques changements autour de l’API Thread en non preview (main API).
  • Les ScopedValues sont comme les ThreadLocals par (virtual) thread, mais elles sont immuables une fois écrites.
  • Use cases : copie d’état pour des données non changeantes pour le virtual thread.
  • Serait intéressant d’avoir des details dessus.

PDF 2.0 maintenant un vrai format ISO ouvert et gratuit https://www.pdfa.org/sponsored-standards/

  • Standard disponible sans coût.
  • Versions précédentes étaient payantes.
  • Clarifications et corrections de beaucoup de cas aux limites.

Librairies

Écrire un Profiler en 240 lignes de Java https://mostlynerdless.de/blog/2023/03/27/writing-a-profiler-in-240-lines-of-pure-java/

  • Ce n’est peut-être pas si compliqué d’écrire soi-même un Java Profiler ! Et justement cet article nous montre comment le faire, en créant un Java Agent, en analysant les stacks d’appel, et à la fin en créant même un flame graph en HTML.
  • Très didactique !
  • Fondamentalement : appeler Threads:getAlStackStrace régulièrement, faire une liste des méthodes visibles et créer un flamegraph à partir de ces données.

L’équipe de Flutter partage les grands thèmes de sa roadmap https://flutter.dev/go/strategy-2023

  • Performance, interopérabilité, portabilité, écosystème, sécurité, fondamentaux (comme la documentation, la fidélité des UI natives, adresser les issues publiques).

Quarkus 3 est sorti https://quarkus.io/quarkus3/

  • On a déjà couvert.
  • Hibernate ORM 6.2.
  • Nouvelle DevUI et admin sur un port different.
  • Support for Pact.
  • quarkus deploy et extensibilité de la CLI avec de nouveaux verbes.
  • Dev Services for Kubernetes simule un Kube pour tester les calls vers l’API Kube.
  • Java 11 et 17 (recommandé).
  • Jakarta EE.
  • Eclipse MicroProfile 6.

Une librairie en Java spécialement pour l’astronomie par Cédric Champeau https://melix.github.io/blog//2023/04-22-introducing-astro4j.html

  • Différentes librairies et applications pour traiter les images issues de Sol’Ex.
  • Sol’Ex permet de prendre des photos du soleil.

Micronaut 4 milestone 2 est sorti. Les nouveautés de Micronaut 4 https://docs.micronaut.io/4.0.0-M2/guide/index.html#whatsNew

  • Kotlin 1.8.0.
  • Experimental Support for Kotlin Symbol Processing (KSP).
  • Apache Groovy 4.0.
  • Core Changes :
    • Java 17 Baseline,
    • Improved Modularity,
    • GraalVM Metadata Repository and Runtime Initialization,
    • Completed javax to jakarta Migration,
    • Expression Language,
    • Injection of Maps,
    • Arbitrary Nesting of Configuration Properties,
    • Improved Error Messages for Missing Configuration,
    • Improved Error Messages for Missing Beans,
    • Tracking of Disabled Beans.
  • HTTP Changes :
    • Initial Support for Virtual Threads (Loom),
    • Rewritten HTTP layer,
    • Annotation-Based HTTP Filters,
    • JDK HTTP Client.

Infrastructure

5 choses à savoir sur Podman Desktop pour un utilisateur Docker https://podman-desktop.io/blog/5-things-to-know-for-a-docker-user

  • Une UI unique pour travailler avec différents moteurs de conteneurs, et pas uniquement Docker.
  • Compatible avec Docker avec un mode adapté pour fonctionner aussi avec la docker CLI ou docker.sock pour les sockets.
  • Support de Compose.
  • Support de Kubernetes.
  • Sécurité : on peut utiliser rootless sans avoir les privilèges root.
  • Socket est particulièrement utile pour TestContainer.
  • compose n’est pas supporté en tant que tel, mais on peut faire utiliser podman par compose.
  • Podman peut émuler / exécuter des definitions de pods.
  • Si besoin d’exposer des ports <1024, on peut activer le mode root.

Keycloak rejoins la CNCF [https://www.tfir.io/keycloak-cloud-native-iam-for-cloud-native-applications-joins-the-cncf/)

  • IAM complete au sein de la CNCF.
  • Keycloak sur base Quarkus : “cloud natif”.

Cloud

Un court article de chez Baeldung qui liste des distributions Kubernetes légères et partage leurs avantages et inconvénients respectifs https://www.baeldung.com/ops/kubernetes-lightweight-distributions

  • Minikube (que des clusters à nœud unique),
  • MicroK8S (à jour avec les releases Kubernetes, mais pas de support des CPUs ARM32),
  • Kind (conteneurs considérés comme des nœuds, plus difficile à configurer avec autre chose que Docker),
  • K3S (moins de consommation de resources).

Google I/O 2023 : la liste des 100 trucs annoncés https://blog.google/technology/developers/google-io-2023-100-announcements/

  • Bard, le concurrent de ChatGPT, disponible dans 180 pays… sauf les pays européens.
  • Pixel 7a, Pixel Tablet et Pixel Fold.
  • Plein d’annonces autour de l’AI avec l’API PaLM (utilisée dans Bard), plein de Generative AI de partout dans les produits (search, workspace,..), y compris un modèle de code (qui comprend même le Groovy) qui va être intégré aux IDE, VSCode, etc.

Outillage

Connaissiez-vous le flag --json de curl ? https://glaforge.dev/posts/2023/03/22/curl-s-json-flag/

  • Ça simplifie les interactions avec les APIs qui utilisent du JSON.
  • Plus besoin de passer les headers de Content-Type et d’Accept, c’est moins verbeux.
  • Rajouté il y a un an dans curl 7.82 (pour info, sur mon mac, par exemple, je suis en 7.86).
  • curl --json '{ "drink": "coffe" }' https://example.com ou curl --json @prepared https://example.com pour pointer vers un fichier.

Rétropédalage chez Docker https://www.docker.com/blog/no-longer-sunsetting-the-free-team-plan/

Github supprime le sponsoring par Paypal… et plein de développeurs Open Source perdent leurs sponsorships https://github.com/orgs/community/discussions/45183

Github a mis à jour sa clé RSA SSH Host https://github.blog/2023-03-23-we-updated-our-rsa-ssh-host-key/

  • Apparemment, ils ont commité brièvement leur clé privée, oops !
  • Potentielle disruption pour certains, avec impossibilité de committer son code.
  • Il faut alors “oublier” l’ancienne clé publique et mémoriser la nouvelle.
  • Personnellement, j’ai commité du code à partir de Visual Studio Code et je n’ai pas eu de soucis.
  • Que sur RSA et pas sur les clés à courbe elliptique.
  • Clé privée aurait pu faire du spoofing ou du déchiffrement de flux en SSH via RSA vers GitHub.

2ème anniversaire de JReleaser https://andresalmiray.com/jreleasers-second-birthday/

  • JReleaser permet de publier sur plusieurs appstores (Homebrew, JBang, etc).
  • Publie sur maven central automatiquement.
  • Publie les annonces sur Twitter, Zulip…
  • Publication de binaires (GitHub…) et de changelogs.

Architecture

Introduction à CloudEvents https://atamel.dev/posts/2023/04-03_cloudevents_basics/

  • Décrire des évènements de données de manière commune.
  • Métadonnées standardisées pour le routage
  • En JSON ou en cloudevents+json.
  • Métadonnées incluent : id, source, type, sujet, time, type de contenu de donnée, schema de données et des extensions comme partitioning…
  • Binary mode : données dans le corps du message, et métadonnées en header. Efficace pour parsing minimal.
  • Structured-mode : données et métadonnées dans la même enveloppe.
  • Batch-mode : plusieurs évènements en un seul envoi.
  • Formats : JSON, protobuf, Avro et XML.
  • Protocoles : HTTP, AMQP, Kafka, MQTT, NATS, WebSocket.
  • Des évolutions futures planifiées.

GraphQL, tout n’est pas si rose https://betterprogramming.pub/graphql-from-excitement-to-deception-f81f7c95b7cf

  • Pour Facebook qui pense en tant que graphe de données.
  • Pour leur application mobile qui devait être à bande passante limitée.
  • Choses positives : une requête pour plusieurs resources, sélection des données dont on a besoin uniquement, typé (entre client et serveur), meilleur outillage dev pour l’exploration, pas de soucis de version d’API ?
  • Équipe qui embrace GraphQL en 2019.
  • Les perfs optimisées par un choix de données ne se sont pas matérialisées pour eux (sauf mobile, donc pas machine-machine ou machine-desktop).
  • La latence de REST reste mieux que GraphQL.
  • En pratique desktop et mobile sont assez similaires en données fetchées.
  • Schémas apportaient des problèmes en pratique ; synchro front et back, code first generation avait des problèmes de qualité du code généré.
  • Schema → code est meilleur, mais synchro front back toujours un problème en pratique.
  • Erreurs, plus simple en rest avec les codes HTTP a debugger et monitorer.
  • Version free est un mensonge, les schemas ne peuvent être cassés.
  • La pagination est compliquée et non standard. Caching primitif comparé à REST.
  • N+1 problem comme dans les ORMs ou alors dataloaders qui amène de la complexité.
  • La sécurité est plus compliquée à cause de la navigation libre de GraphQL.
  • Écosystème pas encore super mature pour les besoins et paradoxalement très complexe.

Méthodologies

Trends technologie et culture par InfoQ https://www.infoq.com/articles/culture-trends-2023/

  • Les licenciements ont cassé les effets de psychological safety dans l’industrie.
  • Les IA génératives ont un impact fort sur la productivité du développeur, mais aussi avec des faiblesses significatives.
  • Au-delà du légal, les responsabilités sociétales deviennent plus importantes pour retenir employés et clients.
  • Le travail asynchrone devient plus accepté socialement, et adopter les pratiques apporte des bénéfices réels.
  • Le travail hybride devient la norme, amener les gens ensemble devient un choix délibéré, plus un horaire fixe.

Loi, société et organisation

Red Hat fête ses 30 ans ! (limite, on n’était même pas nés, hein ?) https://www.redhat.com/en/blog/red-hat-30th-anniversary-celebrating-red-hat-day-north-carolina

Red Hat licencie 4% de ses employés https://wraltechwire.com/2023/04/24/red-hat-cutting-hundreds-of-jobs-ceo-says-in-letter-to-employees/

  • IBM avait annoncé 3900 licenciements il y a peu et cela monte à 5000 avec les licenciements chez Redhat (les effectifs étaient de 2200 à Raleigh et 19000 à l’international).
  • Licenciements suite au contexte économique post-Covid, les revenus trimestriels de Red Hat n’ont été que de 8% en Q1 alors que la croissance était de 15 depuis l’acquisition de Red Hat par IBM en 2019.

Crazy Bob est décédé 😭 https://www.sfgate.com/bayarea/article/mill-valley-man-killed-sf-stabbing-17878809.php

10 millions de comptes sur Mastodon https://mastodon.social/@mastodonusercount/110051957865629817

  • Peut-être pas 10 millions de comptes actifs, mais d’autres commentateurs estiment le nombre d’actifs serait plutôt de 6 à 7 millions actifs, pour effectivement 10 millions de comptes créés donc certains inutilisés ou disparus (serveur disparu).

Gordon Moore meurt à 94 ans https://www.lemonde.fr/economie/article/2023/03/26/mort-de-gordon-moore-entrepreneur-par-accident-et-cofondateur-d-intel_6167037_3234.html

  • Chimiste de formation, il refuse de bosser autour de la bombe atomique et fini dans la silicon valley.
  • Fonde un des premiers semi-conducteurs (plusieurs transistors ensembles).
  • Intel sera un des premiers à parier sur le silicium (pour construire de la mémoire) et un des premiers à faire une puce intégrée regroupant plusieurs fonctions.

Twitter open source ses algorithmes de recommendation https://blog.twitter.com/engineering/en_us/topics/open-source/2023/twitter-recommendation-algorithm

  • On retrouve le code source sur Github https://github.com/twitter/the-algorithm-ml.
  • Et quelqu’un a déjà trouvé où il y a des clauses particulières pour le cas où un tweet vient d’Elon Musk, où un tweet vient d’un républicain ou d’un démocrate : https://uwyn.net/@danluu@mastodon.social/110119479811452246.
  • L’algorithme de Twitter https://aakashgupta.substack.com/p/the-real-twitter-files-the-algorithm.
  • Analyse sans sensation.
  • Trois étapes : aggravation des données, construction des “features”, mixage.
  • Followers, nos tweets et nous.
  • Plus gros booster likes 30x, puis retweet 20x.
  • Feature : SimCluster : groupe par categories/personnes le tweet.
  • Feature : TwHIN : vecteur de prediction d’engagement pour un tweet donné.
  • Feature : RealGraph : prend le tweet, le tweeter et le tweeté et construit un graphe pondéré de potentiel d’interaction.
  • Règles de confiance et sécurité : élimine certains sujets (cela censure plus depuis Elon Musk)
  • Mixer : prend tout et construit la “timeline”.
  • Utilisateur répond aux réponses : x75.
  • En fait que 80% du code ouvert.

The end of faking it in silicon valley https://www.nytimes.com/2023/04/15/business/silicon-valley-fraud.html

  • Les startups qui brulaient du cash sans business model clair.
  • Procès et prisons pour falsification de données clients.
  • Les approches non éthiques ne sont plus ignorées.
  • Avant les investisseurs avaient peur de se mettre les créateurs de boite à dos, maintenant, l’argent vaut cher.
  • “finding out who is swimming naked when the tide goes out” Warren Buffett.
  • “It feels like we were in a nightclub and the lights just turned on”.
  • Ils vont évaluer plus exhaustivement les fondateurs.
  • Le problème, c’est que VC c’est sur la confiance (one-way au moins) et que là, c’est cassé.

Rubrique débutant

On parle souvent de librairies et de frameworks, mais c’est quoi la différence ? https://www.red-gate.com/simple-talk/development/other-development/the-difference-between-libraries-and-frameworks/

  • Une librairie est une collection de classes, de fonctions, de code, que l’on peut utiliser pour des tâches spécifiques, pour éviter au développeur de réinventer la roue (par exemple une librairie comme Joda Time qui permet de simplifier / codifier la représentation du temps).
  • Il y a différents types de librairies : des librairies statiques ou dynamiques, suivant qu’elles sont chargées au runtime ou bien attachées au code que l’on compile. Il y a des librairies standards (comme celles venant du JDK et donc inclues avec lui) ou des librairies tierces (que l’on va par exemple trouver sur Maven Central).
  • Un framework (un “cadriciel” en bon français) c’est aussi un ensemble de code, mais aussi de librairies, qui va offrir un cadre de développement pour ses applications.
  • Par exemple un framework Web qui permet de créer des applications Web plus facilement, ou Tensorflow pour développer de nouveaux algorithmes d’intelligence artificielle, ou Unity pour développer des jeux vidéos.
  • Mais un framework est effectivement plus “cadrant” dans le sens où on doit suivre ses recommendations sur comment structurer son code, comment étendre des classes ou interfaces du framework, etc.
  • Ainsi que les bonnes pratiques et parfois une boite à outil “prêt à l’emploi” vs assemblage.
  • Article qui décrit les pour et les contre.

Conférences

Une liste de conférences Java https://javaconferences.org/

La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/


LCC 294 - A Devoxx France 2023 en chair en os et en béret

Posté le 17/04/2023

Les Cast Codeurs font la clôture de Devoxx France 2022 en chair, en os et en béret.

Enregistré le 14 avril 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-294.mp3

Interview

La vidéo du direct Devoxx France qui est plus facile à suivre se trouvera sur YouTube.

Nous contacter

Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Faire un crowdcast ou une crowdquestion
Contactez-nous via twitter https://twitter.com/lescastcodeurs
sur le groupe Google https://groups.google.com/group/lescastcodeurs
ou sur le site web https://lescastcodeurs.com/


LCC 293 - Interview Maven et builds reproductibles avec Hervé Boutemy

Posté le 06/04/2023

Dans le cocon de JChateau, Hervé Boutemy se fait interviewer par Charles Sabourdin sur Maven 3, 4, 5 et sur les builds reproductibles. Un grand merci à Charles pour son passage derrière le micro.

Enregistré le 18 mars 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-293.mp3

Interview

Twitter Hervé Boutemy

JChateau
JavaDay

Maven et son histoire

Les builds reproductibles
Les builds reproductibles sur la JVM
Les builds reproductibles avec Maven

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/