LCC 305 - Dia critique
Posté le 15/01/2024Cet épisode news discute de langages, de bibliothèques, d’intelligence artificielle bien sûr et même de Web. Et puis de challenge Java et même de Père Noël !
Enregistré le 12 janvier 2024
Téléchargement de l’épisode LesCastCodeurs-Episode-305.mp3
News
RIP Niklaus Wirth https://en.wikipedia.org/wiki/Niklaus_Wirth
- Informaticien Suisse
- Conception des langages ALGOL, Modula-2 et… Pascal
- Plusieurs distinctions: Turing 1984, John Von Neumann 1994. Depuis 1987 un prix créé à son honneur
- Plusieurs livres dont Algorithms + Data Structures = Programs 1976
- La Loi de Wirth: La beauté d’un programme réside dans la clarté de sa structure. Niklaus Wirth a toujours prôné la simplicité, la lisibilité et la compréhensibilité. Approche pragmatique
https://recording.zencastr.com/lescastcodeurs/news-305
Langages
L’enfer sur terre: equals and hashCode pour les entitées JPA. Tout le monde a un avis, faire le sien est compliqué
- https://vladmihalcea.com/hibernate-facts-equals-and-hashcode/
- https://vladmihalcea.com/how-to-implement-equals-and-hashcode-using-the-jpa-entity-identifier/
- https://vladmihalcea.com/the-best-way-to-implement-equals-hashcode-and-tostring-with-jpa-and-hibernate/
- https://jpa-buddy.com/blog/hopefully-the-final-article-about-equals-and-hashcode-for-jpa-entities-with-db-generated-ids/
Kotlin va t’il décliné en 2025, faute d’innovation et avec les nouvelles features de Java ? https://shiftmag.dev/kotlin-vs-java-2392/
- Selon l’auteur, d’autres langages alternatifs pour la JVM ont décliné, comme Groovy et Scala
- L’auteur pense qu’il y aura de moins en moins de différenciants par rapport à Java, et Kotlin n’a pas rajouté de fonctionnalités significatives depuis un an ou deux
Comment enlever des accents et autres marques diacritiques dans des chaines de caractères en Java https://glaforge.dev/posts/2024/01/url-slug-or-how-to-remove-accents-in-java/
- Pour les URLs d’un blog post, par exemple, on souhaite avoir le titre dans l’URL, mais de manière URL-friendly, donc sans accents, en remplaçant les espaces par des tirets, etc
- Guillaume propose une approche basée sur la normalisation de chaine unicode et les expressions régulières
- Mais il évoque également la librairie Slugify qui est en plus capable de faire de la translitération (pour transformer aussi des idéogrammes et autre caractères non-ASCII)
Les “gatherers” de JDK 22 https://blog.soebes.io/posts/2024/01/2024-01-07-jdk-gatherer/
- Nous avons mentionné récemment le JEP 461 pour Java 22 : Stream Gatherers, qui sera en preview
- Permet de faire des choses qui étaient un peu compliquées à faire avec l’API stream avant, comme par exemple implémenter des fenêtres glissantes sur les données du stream
- L’article parle des différentes capacités des gatherers, avec un Integrator, un Initializer et un Finisher, et enfin un Combiner, avec différents exemples de code pour les illustrer
Librairies
Le fonds tech souverain d’origine allemande sponsorise le développement de Log4J https://www.sovereigntechfund.de/news/log4j-investment
- 3 contributeurs pourront bosser dessus à temps plein
- permet de sécuriser le développement du projet
- réaction à l’impact de la CVE Log4shell qui avait bien marqué les esprits et fait bosser plein de gens le weekend pour tout patcher !
Cloud
Le glossaire de la Cloud Native Foundation a été traduit en Français https://glossary.cncf.io/fr/
Web
Sortie de Vue.JS 3.4 https://blog.vuejs.org/posts/vue-3-4
- le parseur de composants (SFC) est 2x plus rapide
- amélioration du système de réactivité en particulier pour les propriétés “computed” (recalculées)
- le namespace JSX deprecated a été supprimé
- Cédric Exbrayat de NinjaSquad couvre également les nouveautés dans cet article https://blog.ninja-squad.com/2023/12/29/what-is-new-vue-3.4/
Astro JS 4.1 https://astro.build/blog/astro-410/
- Découverte de ce FW grâce à Petipois https://medium.com/front-end-weekly/create-a-website-using-astro-in-2024-f5963003c19c
- Astro est le framework web pour la construction de sites web axés sur le contenu tels que les blogs, le marketing et le commerce électronique. Astro est surtout connu pour être le pionnier d’une nouvelle architecture frontend afin de réduire la surcharge et la complexité de JavaScript par rapport aux autres frameworks
- Architecture en “Astrot Islands” (interface en composants isolés)
- SSG et SSR (Static Site Generator ey Server Side Rendering)
- 0 Javascript si tu veux
- Tu utilises React, Angular ou Vue pour tes composants
- Lis plus ici : https://kinsta.com/fr/blog/astro-js/
React à 10 ans… et là ma découverte de React Server Components https://www.joshwcomeau.com/react/server-components/#introduction-to-react-server-components-3
- “At a high level, React Server Components is the name for a brand-new paradigm. In this new world, we can create components that run exclusively on the server.”
- L’idée est de n’est pas faire des composants entiers en react dans le backend, et de n’est pas déléguer aux rendering client pour ces composants
Prédictions 2024 https://thenewstack.io/2024-predictions-by-javascript-frontend-framework-maintainers/
- Angular: Optional Zone.JS
- Next.js (nouveau compilateur, + backend ?)
- React: adoption de React Server Components, SPA ne suffit pas. React auto-memorizing (useCallback/useMemo deprecate)
- Solid 2.0 viendra après SolidStart (framework web)
Data et Intelligence Artificielle
Retour d’experience sur faire du RAG avec des LLMs https://x.com/taranjeetio/status/1742587923189596531?s=20
Gunnar Morling a lancé le 1 billion row challenge : https://www.morling.dev/blog/one-billion-row-challenge/
- L’idée est de calculer le min / max, la moyenne, de températures, indiquées ligne par ligne dans un énorme fichier
- Il y a énormément de contributions. Les plus rapides ont utilisé des memory mapped files, ou bien des instructions SIMD
- Le challenge était en pur Java, mais d’autres personnes ont tenté l’expérience avec diverses bases de données ou autres langages de programmation
Didier Girard parle de Shadow AI https://www.linkedin.com/posts/didiergirard_shadowai-genai-gouvernance-activity-7150031627006464000-IF1G/
- Comme on a parlé de “shadow IT” à une époque, la nouvelle ombre du jour, c’est l’intelligence artificielle
- Pour être plus productifs, les employés utilisent l’IA, sans forcément le dire à leur employeur
- Le problème étant qu’avec certains système d’IA, les données que vous envoyées peuvent être sauvegardées et utilisées pour ré-entrainer l’IA… et potentiellement, l’IA pourrait recracher verbatim du texte provenant de ces données à d’autres utilisateurs. D’où une brèche dans la sécurité des données de l’entreprise
Appel de fonction avec le LLM Gemini de Google https://glaforge.dev/posts/2023/12/22/gemini-function-calling/
- Les Large Language Model sont limités par les connaissances qu’ils ont acquises lors de leur entrainement
- Une approche possible pour se baser sur une base documentaire est d’utiliser l’approche Retrieval Augmented Generation (RAG) où l’on utilise une base de données vectorielle pour récupérer des passages de texte qui correspondent à la requête demandée
- Mais il existe aussi une approche intéressante qui permet d’appeler des systèmes externes (APIs, service local, etc) en permettant au LLM de savoir qu’il peut répondre à une demande donnée en se basant sur l’appel d’une fonction. Dans cette approche, le LLM répond qu’il faudrait appeler une fonction (par exemple pour connaitre la météo à Paris) et il indique quels paramètres passer (“Paris”). Le développeur ensuite appel cette fonction et retourne le résultat de l’invocation au LLM, qui va ensuite pouvoir générer du texte avec ces données.
- C’est l’approche “function calling” qui permet d’étendre à un LLM pour lui donner accès à des données live, derrière une API, etc
Méthodologies
Une video sur le père Noël et la pensé critique de la Tronce en Biais https://youtu.be/tqlYKO_asFw?si=g1Fq5OfCvQONNb2i
- Vidéo interessante pour comprendre comment nous, dans la tech, on peut tomber facilement sur des croyances qui sont doutantes si on développe pas l’esprit critique.
- Le père Noël, véritable complot planétaire des adultes, magasins, médias … d’un mensonge
- Un enfant qui essaie d’appliquer le procédé épistémologique, il n’a pas d’autre source pour vérifier que le père noël n’existe pas, tous ses sources fiables duquel il apprend le monde (parents, profs, medias, histoires, medias) valident que le père noël existe.
- Expliquer les incoherences par la magie, c’est quelque chose de complément banal dans l’univers d’un enfant à qui on parle en permanence de magie
- La découverte de la mensonge aux alentours de 7 ans, l’age de la raison, est une bonne opportunité pour aborder l’esprit critique avec les enfants
Loi, société et organisation
EU AI Act cheat sheet https://www.linkedin.com/posts/yann-lecun_eu-ai-act-cheat-sheet-understand-activity-7139980837013331971-TDqI?utm_source=share&utm_medium=member_ios
- Les entreprises vont avoir 1 ou 2 ans pour s’y conformer
- Basics: Definition de l’AI, extraterritorialité, exceptions (oss, r&D, mais aussi défense …), classification par niveaux de risks (Prohibited > High Risk > Limited Risk > Minimal Risk)
- Prohibited: Biometrique, social credit scoring, detection d’emotions, renforcement des lois basées sur l’identification biometrique en public
- High (des régles sont définies pour controler ces usages: transparence, qualité, risque …): Le matériel médical, les véhicules, l’éducation, les élections, …
- General: Transparence et information
ChatGPT n’est pas un super médecin https://x.com/drhughharvey/status/1736308984288563550?s=46&t=C18cckWlfukmsB_Fx0FfxQ
- ces d’utilisation ChatGPT en copilote
- Trop de non déterminisme dans les réponses à la même question
- 41% des réponses dans le consensus médical
- 7% dangereuse
- Faire du rag n’a monté que de quelques pourcents 5
Transcription de la conférence donnée PGConf EU par Laetitia Avrot et Karen Jex (expertes Postgresql): Trying to be Barbie in Ken’s Mojo Dojo Casa House https://karenjex.blogspot.com/2023/12/trying-to-be-barbie-in-kens-mojo-dojo.html
- Il s’agit d’une conférence en sociologie. En sociologie, il suffit que quelque chose soit vrai pour la majorité des cas pour être considéré comme une vérité, car cela repose sur des statistiques.
- Sujet donné pour susciter de l’attention sur un problème qui existe bien dans la tech. Elles ont réalisé que la grande majorité de la population n’en était pas consciente (barbie)! Le film Barbie les a fait comprendre qu’elles doivent expliquer ce à quoi les femmes sont confrontées au quotidien, afin que les autres puissent comprendre à quel point cela peut être épuisant.
- Très bien documenté avec bcp de liens et références au delà de l’expérience personnelle
- Transcription et slides dans l’article
- Lien entre film Barbie et la place des femmes dans la tech. Idées non neuves mais cela a été un impact
- Les biais en général ne sont pas particuliers à un genre, sont globales. Test sur les biais implicites
- Il existe un déficit de talents technologiques (estimé atteindre de 1,4 million à 3,9 millions de personnes d’ici 2027 dans les pays de l’UE-27), qui pourrait potentiellement être comblé en doublant la proportion de femmes dans le secteur technologique. Cependant, la part des femmes dans les rôles technologiques connaît sa plus basse représentation dans les domaines en pleine croissance tels que DevOps et le cloud.
- plus de la moitié des femmes quittent l’industrie technologique 10 à 20 ans après le début de leur carrière, soit le double du taux des hommes. (manque d’opportunités, difficultés face aux biais, se sentir comme une outsider etc…)
- La part des femmes dans les rôles technologiques en Europe risque de diminuer pour atteindre 21% d’ici 2027.
- Solutions: roles modèles, combattre nos biais (si on ne les reconnait pas, on ne peut pas le combattre), mentoring, faire attention à donner de la voix etc…
New York Times porte plainte à open ai https://www.bbc.com/news/technology-67826601
- réclame des billions en copy right, suit aussi Microsoft et Bing qui utilise open ai
- on peut trouver des extraits des articles avec suscription disponibles
- Si on demande à chat gpt sur des news actuelles, reprend des explications tirés du NYT sans le mentionner
- Sur bing on peut trouver aussi des extraits sans citer ni linker la source
- Conséquences pour NYT: moins d’accès à leur site, moins de consultations, moins des clicks, chute des suscriptions, pertes monétaires importantes
- Réponse de OpenAI au NYT https://openai.com/blog/openai-and-journalism
- We collaborate with news organizations and are creating new opportunities
- Training is fair use, but we provide an opt-out because it’s the right thing to do
- “Regurgitation” is a rare bug that we are working to drive to zero
- The New York Times is not telling the full story
Outils de l’épisode
Userscripts https://github.com/quoid/userscripts: extension pour changer le CSS et JS des sites dans votre navigateur
Rubrique débutant
Guillaume a publié 2 “codelabs” pour démarrer sur LangChain4J, en utilisant le LLM PaLM de Google https://glaforge.dev/posts/2023/12/18/get-hands-on-codelabs-to-dabble-with-llms/
- Ces 2 tutoriels pratiques permettent de découvrir les deux modèles text et chat de PaLM
- Différentes tâches sont illustrées pour faire de simples questions/réponses, de simples chat, mais aussi comment extraire des données structurées d’un texte, comment faire de la classification (avec un exemple d’analyse de sentiment)
Google Summer of Code - appel aux projets https://summerofcode.withgoogle.com/
Conférences
La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :
- 31 janvier 2024-3 février 2024 : SnowCamp - Grenoble (France)
- 1 février 2024 : AgiLeMans - Le Mans (France)
- 6 février 2024 : DevFest Paris - Paris (France)
- 8-9 février 2024 : Touraine Tech - Tours (France)
- 15-16 février 2024 : Scala.IO - Nantes (France)
- 6-7 mars 2024 : FlowCon 2024 - Paris (France)
- 14-15 mars 2024 : pgDayParis - Paris (France)
- 19 mars 2024 : AppDeveloperCon - Paris (France)
- 19 mars 2024 : ArgoCon - Paris (France)
- 19 mars 2024 : BackstageCon - Paris (France)
- 19 mars 2024 : Cilium + eBPF Day - Paris (France)
- 19 mars 2024 : Cloud Native AI Day Europe - Paris (France)
- 19 mars 2024 : Cloud Native Wasm Day Europe - Paris (France)
- 19 mars 2024 : Data on Kubernetes Day - Paris (France)
- 19 mars 2024 : Istio Day Europe - Paris (France)
- 19 mars 2024 : Kubeflow Summit Europe - Paris (France)
- 19 mars 2024 : Kubernetes on Edge Day Europe - Paris (France)
- 19 mars 2024 : Multi-Tenancy Con - Paris (France)
- 19 mars 2024 : Observabiity Day Europe - Paris (France)
- 19 mars 2024 : OpenTofu Day Europe - Paris (France)
- 19 mars 2024 : Platform Engineering Day - Paris (France)
- 19 mars 2024 : ThanosCon Europe - Paris (France)
- 19-21 mars 2024 : IT & Cybersecurity Meetings - Paris (France)
- 19-22 mars 2024 : KubeCon + CloudNativeCon Europe 2024 - Paris (France)
- 21 mars 2024 : IA & Data Day Strasbourg - Strasbourg (France)
- 22-23 mars 2024 : Agile Games France - Valence (France)
- 26-28 mars 2024 : Forum INCYBER Europe - Lille (France)
- 28-29 mars 2024 : SymfonyLive Paris 2024 - Paris (France)
- 28-30 mars 2024 : DrupalCamp Roazhon - Rennes (France)
- 4-6 avril 2024 : Toulouse Hacking Convention - Toulouse (France)
- 17-19 avril 2024 : Devoxx France - Paris (France)
- 18-20 avril 2024 : Devoxx Greece - Athens (Greece)
- 22 avril 2024 : React Connection 2024 - Paris (France)
- 23 avril 2024 : React Native Connection 2024 - Paris (France)
- 25-26 avril 2024 : MiXiT - Lyon (France)
- 25-26 avril 2024 : Android Makers - Paris (France)
- 8-10 mai 2024 : Devoxx UK - London (UK)
- 16-17 mai 2024 : Newcrafts Paris - Paris (France)
- 22-25 mai 2024 : Viva Tech - Paris (France)
- 24 mai 2024 : AFUP Day Nancy - Nancy (France)
- 24 mai 2024 : AFUP Day Poitiers - Poitiers (France)
- 24 mai 2024 : AFUP Day Lille - Lille (France)
- 24 mai 2024 : AFUP Day Lyon - Lyon (France)
- 2 juin 2024 : PolyCloud - Montpellier (France)
- 6-7 juin 2024 : DevFest Lille - Lille (France)
- 6-7 juin 2024 : Alpes Craft - Grenoble (France)
- 11-12 juin 2024 : OW2con - Paris (France)
- 12-14 juin 2024 : Rencontres R - Vannes (France)
- 14 juin 2024 : DevQuest - Niort (France)
- 27-28 juin 2024 : Agi Lille - Lille (France)
- 4-5 juillet 2024 : Sunny Tech - Montpellier (France)
- 19-20 septembre 2024 : API Platform Conference - Lille (France) & Online
- 7-11 octobre 2024 : Devoxx Belgium - Antwerp (Belgium)
- 10-11 octobre 2024 : Volcamp - Clermont-Ferrand (France)
- 10-11 octobre 2024 : Forum PHP - Marne-la-Vallée (France)
- 17-18 octobre 2024 : DevFest Nantes - Nantes (France)
- 6 novembre 2024 : Master Dev De France - Paris (France)
Nous contacter
Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs
Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/
LCC 304 - Dark punk
Posté le 18/12/2023Dans cet épisode, Katia, Arnaud et Emmanuel discutent les nouvelles de cette fin 2023. Le gatherer dans les stream Java, les exceptions, JavaScript dans la JVM, recherche vectorielle, coût du cloud, Gemini, Llama et autres animaux fantastiques et pleins d’outils sympathiques pour fêter la fin de l’année.
Enregistré le 15 décembre 2023
Téléchargement de l’épisode LesCastCodeurs-Episode-304.mp3
News
Aide Les Cast Codeurs et remplis un petit formulaire pour nous guider l’année prochaine https://lescastcodeurs.com/sondage
Langages
Avec JEP 461, arrivée dans en preview en Java 22 de la notion de gatherer pour les streams https://groovy.apache.org/blog/groovy-gatherers
- Dans cet article de Paul King, de l’équipe Groovy, il montre et contraste avec ce que l’on pouvait faire en Groovy depuis des années, comme des sliding windows par exemple.
- Explique l’approche des gatherers avec ses opérations intermédiaires.
- Les gatherers sont des operations intermédiaires spécifiques qui prennent un état et le prochain élément pour décider quoi faire, et même changer le stream d’éléments suivants (via la fonction
integrate
). - Certains peuvent permettre de combiner les résultats intermédiaires (pour paralléliser).
- Exemples : fenêtres de taille fixe, fenêtres glissantes.
Joe Duffy, qui est CEO de Pulumi mais qui avait travaillé chez Microsoft sur le project Midori (un futur OS repensé), parle du design des exceptions, des erreurs et des codes de retour https://joeduffyblog.com/2016/02/07/the-error-model/
- Il compare les codes d’erreurs, les exceptions, checked et non-checked.
- Il sépare les bugs des erreurs attendues (les bugs doivent arrêter le process).
- Il raconte l’histoire des unchecked exceptions et de leurs problèmes, des checked exceptions, et pourquoi les développeurs Java les détestent (selon lui).
- Long article, mais intéressant dans ses retours.
- Mais long, je ne suis pas allé au bout 😊.
Après la disparition de Nashorn dans le JDK, on peut se tourner vers le projet Javet https://www.caoccao.com/Javet/index.html
- Javet permet d’intégrer JavaScript avec le moteur V8.
- Mais aussi carrément Node.js.
- C’est super comme capacité, car on a les deux meilleurs moteurs.
- Par contre, le support hors x86 est plus limité (genre ARM sous windows c’est non).
Librairies
Une partie de l’équipe Spring se fait lourder après le rachat effectif de Broadcom https://x.com/odrotbohm/status/1729231722498425092?s=20
- Peu d’info en vrai, à part ce tweet.
- Mais l’acquisition Broadcom n’a pas l’air de se faire dans le monde des Bisounours.
Marc Wrobel annonce la sortie de jbanking 4.2.0 https://www.marcwrobel.fr/sortie-de-jbanking-4-2-0
- Support de Java 21.
- Possibilité de générer aléatoirement des BIC.
- Amélioration de la génération aléatoire d’IBAN.
- jbanking est une bibliothèque pour manipuler des structures typiques des banques, comme les IBAN, les BIC…
Hibernate Search 7 est sorti https://in.relation.to/2023/12/05/hibernate-search-7-0-0-Final/
- Support ElasticSearch 8.10-11 et openSearch 2.10-11.
- Rebasé sur Lucene 9.8.
- Support sur Amazon OpenSearch Serverless (experimental).
- Attention, sous-ensemble de fonctionnalités sur Serverless, c’est un API-first search cluster vendu à la Lambda.
- En lien aussi sur la version 7.1.Alpha1.
Hibernate ORM 6.4 est sorti https://in.relation.to/2023/11/23/orm-640-final/
- Support pour SoftDelete (colonne marquant la suppression).
- Support pour les operations vectorielles (support PostgreSQL initialement).
- Les fonctions vectorielles sont particulièrement utilisées par l’IA/ML.
- Événements spécifiques JFR.
Intégration de citrus et Quarkus pour les tests d’intégrations de pleins de protocoles et formats de message https://quarkus.io/blog/testing-quarkus-with-citrus/
- Permet de tester les entrées / sorties attendues de systèmes de messages (HTTP, Kafka, serveur mail…).
- Top pour tester les applications Event-driven.
- Pas de rapport, mais Quarkus 3.7 ciblera Java 17 (~8% des gens utilisaient Java 11 dans les builds qui ont activé les notifications).
Hibernate Search 7.1 (dev 7.1.0.Alpha1) avec la dernière version de Lucene (9.8), Infinispan rajoute le support pour la recherche vectorielle.
- https://hibernate.org/search/releases/7.1/.
- https://infinispan.org/blog/2023/12/13/infinispan-vector-search.
- Hibernate Search permet maintenant la recherche vectorielle.
- La dernière version est intégrée dans Infinispan 15 (dev).
- La recherche vectorielle et le stockage de vecteurs permettent de convertir Infinispan en Embedding Store (LangChain).
Cloud
Comment choisir sa région cloud https://blog.scottlogic.com/2023/11/23/conscientious-cloud-pick-your-cloud-region-deliberately.html
- Pas si simple.
- Critères :
- le coût,
- la sécurité légale de vos données,
- la consommation carbone de la région choisie (la France est top, la Pologne moins),
- la latence vs où sont vos clients,
- les services supportés.
Web
Vers une standardisation des Webhooks ? https://www.standardwebhooks.com/
- Des gens de Zapier, Twilio, Ngrok, Kong, Supabase et autres, se rejoignent pour essayer de standardiser l’approche des Webhooks.
- La spec est open source (Apache) sur Github.
- Les objectifs sont la sécurité, la fiabilité, l’interopérabilité, la simplicité et la compatibilité (ascendante / descendante).
- Sans la spec, chaque webhook est different dans son comportement et donc les clients doivent s’adapter dans la sémantique, les erreurs…
- La (meta-) structure de la payload, la taille, la sécurisation via signature (p. ex. HMAC), les erreurs (via des erreurs HTTP)…
Data et Intelligence Artificielle
Google annonce Gemini, son nouveau Large Language Model https://blog.google/technology/ai/google-gemini-ai/
- Modèle multimodal qui peut prendre du texte en entrée, mais aussi des images, du son, des vidéos.
- D’après les benchmarks, il est largement aussi bon que GPT4.
- Plusieurs tailles de modèles disponibles : Nano pour être intégré aux mobiles, Pro qui va être utilisé dans la majeure partie des cas, et Ultra pour les besoins de réflexion les plus avancés.
- Android va rajouter aussi des librairies AICore pour utiliser Gemini Nano dans les téléphones Pixel (https://android-developers.googleblog.com/2023/12/a-new-foundation-for-ai-on-android.html).
- Gemini Pro va être disponible dans Bard (en anglais et dans 170 pays, mais l’Europe va devoir attendre un petit peu pour que ce soit disponible).
- Gemini Ultra devrait aussi rejoindre Bard, dans une version étendue (https://blog.google/products/bard/google-bard-try-gemini-ai/).
- Gemini va être intégré progressivement dans plein de produits Google.
- DeepMind parlant de Gemini : https://deepmind.google/technologies/gemini/#introduction.
- Un rapport de 60 pages sur Gemini : https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf.
- Gemini a permis aussi de pouvoir développer une nouvelle version du modèle AlphaCode qui excelle dans les compétitions de coding : https://storage.googleapis.com/deepmind-media/AlphaCode2/AlphaCode2_Tech_Report.pdf.
- Liste de petites vidéos sur YouTube avec des interviews et démonstrations des capacités de Gemini : https://www.youtube.com/playlist?list=PL590L5WQmH8cSyqzo1PwQVUrZYgLcGZcG.
- Malheureusement certaines des annonces sont un peu fausses, ce qui a amené un discrédit (non du) sur Gemini.
- Par exemple la vidéo “aspirationnelle” était vendue comme du réel, mais ce n’était pas le cas. Et ultra n’est pas encore disponible.
- Aussi la comparaison de ChatGPT sur la page (initialement au moins) comparait des choux et des carottes, même si le papier de recherche était correct.
Avec la sortie de Gemini, Guillaume a écrit sur comment appeler Gemini en Java https://glaforge.dev/posts/2023/12/13/get-started-with-gemini-in-java/
- Gemini est multimodèle, donc on peut passer aussi bien du texte que des images, ou même de la vidéo.
- Il y a un SDK en Java pour interagir avec l’API de Gemini.
Facebook, Purple Llama https://ai.meta.com/blog/purple-llama-open-trust-safety-generative-ai/
- Opensource https://ai.meta.com/llama/.
- Dans l’optique des modèles GenAI ouverts, Facebook fournit des outils pour faire des IA responsables (mais pas coupables 😉).
- Notamment des benchmarks pour évaluer la sureté et un classifier de sureté, par exemple pour ne pas générer du code malicieux (ou le rendre plus dur).
- Llama purple sera un projet parapluie.
- D’ailleurs Meta, IBM, Red Hat et pleins d’autres ont annoncé l’AI Alliance pour une IA ouverte et collaborative entre académique et industriels. Sont notamment absent Google, OpenAI (pas ouvert) et Microsoft.
- Juste une annonce pour l’instant, mais on va voir ce que ces acteurs de l’AI Alliance feront de concret.
- Il y a aussi un Responsible Use Guide (pas lu).
Apple aussi se met aux librairies de Machine Learning https://ml-explore.github.io/mlx/build/html/index.html
- MLX est une librairie Python qui s’inspire fortement de NumPy, PyTorch, Jax et ArrayFire.
- Surtout, c’est développé spécifiquement pour les Macs, pour tirer au maximum parti des processeurs Apple Silicon.
- Dans un des repos Github, on trouve également des exemples qui font tourner nativement sur macOS les modèles de Llama, de Mistral et d’autres (https://github.com/ml-explore/mlx-examples).
- Non seulement les Apple Silicon, mais aussi la mémoire unifiée CPU/GPU qui est une des raisons clés de la rapidité des Macs.
Faire tourner Java dans un notebook Jupyter https://www.javaadvent.com/2023/12/jupyter-notebooks-and-java.html
- Max Andersen explore l’utilisation de Java dans les notebooks Jupyter, au lieu du classique Python.
- Il y a des kernels Java selon vos besoins.
- Mais il faut les installer dans la distro jupyter qu’on utilise.
- Et c’est la que jbang, installable via pip, vient à la rescousse.
- Il installe automatiquement ces kernels en quelques lignes.
Outillage
Sfeir liste des jeux orientés développeurs https://www.sfeir.dev/tendances/notre-selection-de-jeux-de-programmation/
- Parfait pour Noël.
- Mais c’est pour ceux qui veulent continuer à challenger leur cerveau après le boulot.
- Jeu de logique, jeu de puzzle avec le code comme forme, jeu autour du machine learning, jeu de programmation assembleur.
Les calendriers de l’Avent sont populaires pour les développeurs ! En particulier avec Advent of Code https://adventofcode.com/
- Mais il y a aussi l’Advent of Java.
- Ou un calendrier pour apprendre les bases de SVG.
- Le calendrier HTML “hell” qui parle d’accessibilité, de web components, de balises meta, de toutes les choses qu’on peut très bien faire en HTML/CSS sans avoir besoin de JavaScript.
- Pour les développeurs TypeScript, il y a aussi un calendrier de l’Avent pour vous !
Un super thread de Clara Dealberto sur le thème de la “dataviz” (data visualization) https://twitter.com/claradealberto/status/1729447130228457514
- Beaucoup d’outil librement accéssibles sont mentionnés pour faire toutes sortes de visualisations (ex. treemap, dendros, sankey…) mais aussi pour la cartographie.
- Quelques ressources de site qui conseillent sur l’utilisation du bon type de visualisation en fonction du problème et des données que l’on a.
- Notamment celui du Financial Times qui tient dans une page de PDF.
- Bref c’est cool, mais c’est long à lire.
Une petite liste d’outils sympas
jc
pour convertir la sortie de commandes unix en JSON (https://github.com/kellyjonbrazil/jc),- AltTab pour macOS, pour avoir le même comportement de basculement de fenêtre que sous Windows (https://alt-tab-macos.netlify.app/),
gron
pour rendre le JSON grep-able, en transformant chaque valeur en ligne ressemblant à du JSONPath (https://github.com/tomnomnom/gron),- gron en fait montre des lignes avec des assignments genre
jsonpath = value
, et tu peux ungroner apres pour revenir à du JSON.
- gron en fait montre des lignes avec des assignments genre
- Marker, en Python, pour transformer des PDF en beau Markdown (https://github.com/VikParuchuri/marker),
- Marker utilise du machine learning, mais il hallucine moins que nougat (nous voilà rassuré).
- n8n un outil de workflow open source https://n8n.io/.
Docker acquiert Testcontainers https://techcrunch.com/2023/12/11/docker-acquires-atomicjar-a-testing-startup-that-raised-25m-in-january/
- Annonce par AtomicJar : https://www.atomicjar.com/2023/12/atomicjar-is-now-part-of-docker/.
- Annonce par Docker : https://www.docker.com/blog/docker-whale-comes-atomicjar-maker-of-testcontainers/.
Architecture
Comment implémenter la reconnaissance de chansons, comme Shazam https://www.cameronmacleod.com/blog/how-does-shazam-work
- Il faut d’abord passer en mode fréquence avec des transformées de Fourrier pour obtenir des spectrogrammes.
- Puis créer une sorte d’empreinte qui rassemble des pics de fréquences notables à divers endroits de la chanson.
- Puis associer ces pics pour retrouver un enchainement de tels pics de fréquence dans le temps.
- L’auteur a partagé son implémentation sur Github : https://github.com/notexactlyawe/abracadabra/blob/e0eb59a944d7c9999ff8a4bc53f5cfdeb07b39aa/abracadabra/recognise.py#L80.
- Il y avait également une très bonne présentation sur ce thème par Moustapha Agack à DevFest Toulouse : https://www.youtube.com/watch?v=2i4nstFJRXU.
- Les pics associés sont des hashs qui peuvent être comparés, et le plus de hash veut dire que les chansons sont plus similaires.
Méthodologies
Un mémo de chez ThoughtWorks à propos du coding assisté par IA https://martinfowler.com/articles/exploring-gen-ai.html#memo-08
- Avec toute une liste de questions à se poser dans l’utilisation d’un outil tel que Copilot.
- Il faut bien réaliser que malheureusement une IA n’a pas raison à 100% dans ses réponses, et même plutôt que la moitié du temps, donc il faut bien mettre à jour ses attentes par rapport à cela, car ce n’est pas magique.
- La conclusion est intéressante aussi, en suggérant que grosso modo dans 40 à 60% des situations, tu peux arriver à 40 à 80% de la solution. Est-ce que c’est à partir de ce niveau-là qu’on peut vraiment gagner du temps et faire confiance à l’IA ?
- Ne perdez pas trop de temps non plus à essayer de convaincre l’IA de faire ce que vous voulez qu’elle fasse. Si vous n’y arrivez pas, c’est sans doute parce que l’IA n’y arrivera même pas elle-même ! Donc au-delà de 10 minutes, allez lire la doc, chercher sur Google…
- Notamment, faire générer les tests par l’IA dans la foulée augmente les risques surtout si on n’est pas capable de bien relire le code.
- Si on introduit un choix de pattern genre flexbox en CSS, si c’est sur une question de sécurité, vérifier (ceinture et bretelle).
- Est-ce le framework de la semaine dernière ? L’info ne sera pas dans le LLM (sans RAG).
Quelles capacités sont nécessaires pour déployer un projet AI/ML https://blog.scottlogic.com/2023/11/22/capabilities-to-deploy-ai-in-your-organisation.html
- C’est le MLOps et il y a quelques modèles end to end (Google, IBM).
- Mais vu la diversité des organisations, il est difficile d’embrasser ces versions complètes.
- MLOps est un métier, data science est un métier, donc intégrer ces compètences.
- Sachez gérer votre catalogue de données.
- Construire un process pour tester vos modèles en continu.
- La notion de culture de la recherche et sa gestion (comme un portefeuille financier, accepter d’arrêter des expèriences etc).
- La culture de la recherche est peu présente en ingénierie, qui est plus de construire des choses qui fonctionnent.
- C’est un monde pré-LLM.
Vous connaissez les 10 dark patterns de l’UX ? Pour vous inciter à cliquer ici ou là, pour vous faire rester sur le site, et plus encore https://dodonut.com/blog/10-dark-patterns-in-ux-design/
- Parmi les dark patterns couverts
- Confirmshaming,
- Fake Urgency and the Fear of Missing Out,
- Nagging,
- Sneaking,
- Disguised Ads,
- Intentional Misdirection,
- The Roach Motel Pattern,
- Preselection,
- Friend Spam,
- Negative Option Billing or Forced Continuity.
- L’article conclut avec quelques pistes sur comment éviter ces dark patterns en regardant les bons patterns de la concurrence, en testant les interactions UX, et en applicant beaucoup de bon sens !
- les dark patterns ne sont pas des accidents, ils s’appuient sur la psychologie et sont mis en place spécifiquement.
Comment choisir de belles couleurs pour la visualisation de données ? https://blog.datawrapper.de/beautifulcolors/
- Plutôt que de penser en RGB, il vaut mieux se positionner dans le mode Hue Saturation Brightness.
- Plein d’exemples montrant comment améliorer certains choix de couleurs.
- Il vaut mieux éviter les couleurs trop pures ou les couleurs trop brillantes et saturées.
- Avoir un bon contraste.
- Penser aussi aux daltoniens !
- J’ai personnellement eu toujours du mal avec saturation vs brightness.
- Faire que les couleurs en noir et blanc soient séparées avant de le remettre (en changeant la brightness de chaque couleur), ça aide les daltoniens.
- Éviter les couleurs aux 4 coins, mais plutôt des couleurs complémentaires (proches).
- Rouge, orange et jaune (non saturé) et variations de bleu sont pas mal.
- Les couleurs saturées sont agressives et stressent les gens.
Pourquoi vous devriez devenir Engineering Manager ? https://charity.wtf/2023/12/15/why-should-you-or-anyone-become-an-engineering-manager/
- L’article parle de l’évolution de la perception de l’engineering management, qui n’est plus désormais le choix de carrière par défaut pour les ingénieurs ambitieux.
- Il met en évidence les défis auxquels les engineering managers sont confrontés, y compris les attentes croissantes en matière d’empathie, de soutien et de compétences techniques, ainsi que l’impact de la pandémie de COVID-19 sur l’attrait des postes de management.
- L’importance des bons engineering managers est soulignée, car ils sont considérés comme des multiplicateurs de force pour les équipes, contribuant de manière significative à la productivité, à la qualité et au succès global dans les environnements organisationnels complexes.
- L’article fournit des raisons pour lesquelles quelqu’un pourrait envisager de devenir Engineering Manager, y compris acquérir une meilleure compréhension de la façon dont les entreprises fonctionnent, contribuer au mentorat et influencer les changements positifs dans la dynamique des équipes et les pratiques de l’industrie.
- Une perspective est présentée, suggérant que devenir Engineering manager peut conduire à la croissance personnelle et à l’amélioration des compétences de vie, telles que l’autorégulation, la conscience de soi, la compréhension des autres, l’établissement de limites, la sensibilité à la dynamique du pouvoir et la maîtrise des conversations difficiles. L’article encourage à considérer la gestion comme une occasion de développer et de porter ces compétences pour la vie.
Sécurité
LogoFAIL une faille du bootloader de beaucoup de machines https://arstechnica.com/security/2023/12/just-about-every-windows-and-linux-device-vulnerable-to-new-logofail-firmware-attack/
- En gros en changeant les images qu’on voit au boot.
- Permet d’exécuter du code arbitraire au tout début de la sécurisation de l’UEFI (le boot le plus utilisé).
- Donc c’est game over parce que ça démarre avant l’OS.
- Ce n’est pas une exploitation à distance, il faut être sur la machine avec des droits assez deja élevés, mais ça peut être la fin de la chaine d’attaque.
- Et, comme d’habitude, un interpréteur d’images est la cause de ces vulnérabilités.
Conférences
L’IA au secours de conférences tech : rajoute des profils tech femme comme speaker au programme pour passer le test diversité online via des profils fake. https://twitter.com/GergelyOrosz/status/1728177708608450705 https://www.theregister.com/2023/11/28/devternity_conference_fake_speakers/ https://www.developpez.com/actu/351260/La-conference-DevTernity-sur-la-technologie-s-effondre-apres-que-l-organisateur-a-admis-avoir-cree-de-fausses-oratrices-generees-automatiquement/
- J’avais lu le tweet du créateur de cette conf qui expliquait que c’était des comptes de tests et que, pris dans le rush, ils avaient oublié de les enlever.
- Mais en fait les comptes de tests ont des profils “Actifs” sur les réseaux sociaux apparemment, donc c’était savamment orchestré.
- Au final beaucoup de speakers et de sponsors se désengagent.
La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :
- 31 janvier 2024-3 février 2024 : SnowCamp - Grenoble (France)
- 1 février 2024 : AgiLeMans - Le Mans (France)
- 6 février 2024 : DevFest Paris - Paris (France)
- 8-9 février 2024 : Touraine Tech - Tours (France)
- 15-16 février 2024 : Scala.IO - Nantes (France)
- 6-7 mars 2024 : FlowCon 2024 - Paris (France)
- 14-15 mars 2024 : pgDayParis - Paris (France)
- 19 mars 2024 : AppDeveloperCon - Paris (France)
- 19 mars 2024 : ArgoCon - Paris (France)
- 19 mars 2024 : BackstageCon - Paris (France)
- 19 mars 2024 : Cilium + eBPF Day - Paris (France)
- 19 mars 2024 : Cloud Native AI Day Europe - Paris (France)
- 19 mars 2024 : Cloud Native Wasm Day Europe - Paris (France)
- 19 mars 2024 : Data on Kubernetes Day - Paris (France)
- 19 mars 2024 : Istio Day Europe - Paris (France)
- 19 mars 2024 : Kubeflow Summit Europe - Paris (France)
- 19 mars 2024 : Kubernetes on Edge Day Europe - Paris (France)
- 19 mars 2024 : Multi-Tenancy Con - Paris (France)
- 19 mars 2024 : Observabiity Day Europe - Paris (France)
- 19 mars 2024 : OpenTofu Day Europe - Paris (France)
- 19 mars 2024 : Platform Engineering Day - Paris (France)
- 19 mars 2024 : ThanosCon Europe - Paris (France)
- 19-21 mars 2024 : IT & Cybersecurity Meetings - Paris (France)
- 19-22 mars 2024 : KubeCon + CloudNativeCon Europe 2024 - Paris (France)
- 26-28 mars 2024 : Forum INCYBER Europe - Lille (France)
- 28-29 mars 2024 : SymfonyLive Paris 2024 - Paris (France)
- 4-6 avril 2024 : Toulouse Hacking Convention - Toulouse (France)
- 17-19 avril 2024 : Devoxx France - Paris (France)
- 18-20 avril 2024 : Devoxx Greece - Athens (Greece)
- 25-26 avril 2024 : MiXiT - Lyon (France)
- 25-26 avril 2024 : Android Makers - Paris (France)
- 8-10 mai 2024 : Devoxx UK - London (UK)
- 16-17 mai 2024 : Newcrafts Paris - Paris (France)
- 24 mai 2024 : AFUP Day Nancy - Nancy (France)
- 24 mai 2024 : AFUP Day Poitiers - Poitiers (France)
- 24 mai 2024 : AFUP Day Lille - Lille (France)
- 24 mai 2024 : AFUP Day Lyon - Lyon (France)
- 2 juin 2024 : PolyCloud - Montpellier (France)
- 6-7 juin 2024 : DevFest Lille - Lille (France)
- 6-7 juin 2024 : Alpes Craft - Grenoble (France)
- 27-28 juin 2024 : Agi Lille - Lille (France)
- 4-5 juillet 2024 : Sunny Tech - Montpellier (France)
- 19-20 septembre 2024 : API Platform Conference - Lille (France) & Online
- 7-11 octobre 2024 : Devoxx Belgium - Antwerp (Belgium)
- 10-11 octobre 2024 : Volcamp - Clermont-Ferrand (France)
- 10-11 octobre 2024 : Forum PHP - Marne-la-Vallée (France)
- 17-18 octobre 2024 : DevFest Nantes - Nantes (France)
Nous contacter
Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs
Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/
LCC 303 - Interview sur Vert.x 4.5 avec Julien Viet
Posté le 04/12/2023Ce qui a commencé comme un crowdcast a fini en interview de Julien Viet sur Vert.x 4.5.
Enregistré le 23 novembre 2023
Téléchargement de l’épisode LesCastCodeurs-Episode-303.mp3
Interview
Ta vie ton oeuvre (présentation de l’interviewé)
Le site de Julien Viet
X (ancien twitter)
Vert.x 4.5
Vert.X 4.5 est sorti https://vertx.io/blog/whats-new-in-vert-x-4-5/
- support des thread virtuels qui permet d’écrire le code synchrone pour des cas complexes et utiliser les thread locaux dans ces cas la. Cela ne remplacement pas le code de process des événements
- le code put faire des future await qui ne bloqueront pas le thread principal
- connection SQL dynamique: quand le host change dynamiquement dans l’application
- support des proxies de niveau 7 pour les clients SQL
- rotation certificats a chaud
- des builders (HTTP, SQL connection)
- extensions pour utiliser les coroutines kotlin
Nous contacter
Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs
Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/
LCC 302 - Amour, Gloire et OpenAI
Posté le 27/11/2023Dans cet épisode, Emmanuel, Guillaume et Katia abordent les nouveautés Java, le lancement du langage Misty par Douglas Crockford, l’arrivée de WasmGC dans Chrome, la sortie de Spring Framework 6.1, des évolutions dans les bibliothèques comme Vert.x 4.5, et des conseils sur la création de langages de programmation. L’épisode couvre également des actualités dans les domaines de l’infrastructure avec le premier ordinateur cloud commercial par Oxide, des annonces sur les frameworks web comme Angular v17, des réflexions sur les architectures monolithiques versus microservices, et sans oublier le soap Opéra du moins de novembre avec OpenAI en vedette.
Enregistré le 23 novembre 2023
Téléchargement de l’épisode LesCastCodeurs-Episode-302.mp3
News
Langages
Recap Javaiste https://www.infoq.com/news/2023/10/java-news-roundup-oct09-2023
- La JEP 454 sur l’appel à la mémoire et les API dites natives passera en target pour JDK 22, avec une façon d’ajouter les appels de méthodes restreintes sans le flag
--enable-native-access
(via un manifeste dans le JAR). - JDK 22 prévu pour mars 2024.
- Spring Framework 6.1 est sorti.
- Tomcat a quelques CVE, donc mettez à jour !
Douglas Crockford, le papa de JSON, sort un nouveau langage dénommé Misty https://www.crockford.com/misty/
- Utilise des caractères unicodes pour définir des chaînes de caractères avec des chevrons, ou pour les opérateurs de base (comparison, and/or).
- Support de la programmation concurrente avec les actors.
WasmGC arrive dans Chrome, par l’intermédiaire de v8 https://v8.dev/blog/wasm-gc-porting
- Historiquement, il fallait compiler le port du langage lui-même (et donc son GC).
- Maintenant, on peut compiler le code (Java) dans des primitives Wasm et WasmGC.
- Java python et co ont des VM qui sont compilées pour toutes les architectures cibles (ARM, x86 etc), y compris le JIT, AOT.
- Donc, on peut définir comme backend WASM lui-même, c’est l’approche classique.
- WasmGC définit des
struct
s et desarray
avec des champs dans lesquels on peut créer des instances, lire/écrire les champs, caster dans d’autres types et ces objets sont gérés par WasmGC lui-même. - On a un système de type du coup et des relations entre ces types.
- Donc on représenterait les objets Java en objets Wasm.
- Avantage et inconvenient des deux approches.
- Tous les codes de management d’objets ne sont plus nécessaires (y compris malloc) ⇒ gain memoire.
- En mode GC dans le langage, les liens objets du langage ↔ objets Wasm sont inefficaces, car les liens langage → Wasm définissent l’instance entière Wasm, donc des gros cycles d’objets ne sont pas GCed.
- Wasm sandbox empêche d’inspecter la stack et d’éliminer des objets plus efficacement, et il n’y a pas d’API pour aider donc seul WasmGC peut utiliser cet avantage.
- Un seul GC a des avantages : meilleure gestion de la pression mémoire.
- Mais on réutilise le GC du Web (genre V8) vs celui de Java. (c’est moins un problème pour les autres langages avec des GC moins sophistiqués).
- La fragmentation mémoire est plus proéminente quand on a des modules de type C qui peuvent garder des gros blocs mémoire “quasi-vides” (opaque). C’est managé plus finement en WasmGC.
- Sémantiques de langage est plus dur à achever vu qu’on map en concepts WasmGC, il y a de la transformation.
- Sémantiques des chaînes de caractères, nombres, etc peuvent être un peu ajustés.
- Un port utilisant WasmGC n’est pas une réécriture de tout, mais un gros morceau de la VM du langage cible est à réécrire.
- WasmGC peut optimiser comme les patterns en JVM, mais en WasmMVP c’est la toolchain avant qui fait le travail d’optimisation (p. ex. LLVM).
- Donc avec WasmGC, la toolchain fera les optimisations de langage et WasmGC fera les optimisations low-level (inlining, constant propagation, dead code elimination).
- Puis d’autres optimisations spécifiques à WasmGC comme les escape analysis.
- Et ils parlent d’optimisations dans V8 pour approcher les appels dynamiques à la Java (pas défini à la compilation).
Écrire un langage de programmation… ça prend du temps… beaucoup de temps https://yorickpeterse.com/articles/a-decade-of-developing-a-programming-language/
- Évitez le gradual typing.
- Évitez le boostrapping de votre compilateur.
- Évitez d’écrire votre propre générateur de code, linker, etc.
- Évitez de tergiverser trop longtemps sur la syntaxe.
- La prise en charge multiplateforme est un défi.
- Les livres sur les compilateurs ne valent pas l’argent que vous dépenserez dessus.
- Faire grandir et évoluer un langage de programmation est difficile.
- La meilleure suite de tests est une application réelle.
- Ne privilégiez pas les performances sur les fonctionnalités.
Librairies
Spring Boot rajoute le hot reload des certificats SSL pour embedded Netty et Tomcat https://spring.io/blog/2023/11/07/ssl-hot-reload-in-spring-boot-3-2-0
- Utilisez
reload-on-update: true
. - Et écoute les changements de fichiers.
- Pas mal dans les déploiements non-immuables (pas comme Kubernetes).
VertX 4.5 est sorti https://vertx.io/blog/whats-new-in-vert-x-4-5/
- Support des threads virtuels qui permet d’écrire le code synchrone pour des cas complexes et utiliser les threads locaux dans ces cas-là. Cela ne remplace pas le code de process des événements.
- Le code peut faire des
future
/await
qui ne bloqueront pas le thread principal. - Connection SQL dynamique : quand le host change dynamiquement dans l’application.
- Support des proxies de niveau 7 pour les clients SQL.
- Rotation des certificats à chaud.
- Des builders (HTTP, SQL connection).
- Extensions pour utiliser les coroutines Kotlin.
Integration déclarative de Langchain4j dans Quarkus https://quarkus.io/blog/quarkus-meets-langchain4j/
Infrastructure
Oxide sort le premier ordinateur cloud disponible commercialement https://oxide.computer/blog/the-cloud-computer
- Pas facile de séparer le buzz de la réalité.
- On dirait un ordi purpose built avec l’efficience et le côté compact en tête.
- Ils poussent contre le mode location uniquement des cloud providers.
- En gros inspiré des cloud providers qui construisent leurs propres ordis (et même CPUs maintenant !).
- Construit le hardware et le software en co-optimisation.
- C’est un rack entier, peu de bruit de ventilateur.
- Pas de cable (seul E/S du rack).
- Donc ils ont leurs propres switch.
- Compliqué de différencier l’avantage du désavantage.
Les leçons tirées de 20 de Site Reliability Engineering par Google https://sre.google/resources/practices-and-processes/twenty-years-of-sre-lessons-learned/
- Le risque d’une mitigation doit être proportionné à la gravité de la panne.
- Les mécanismes de récupération doivent être entièrement testés avant une urgence.
- Canarisez tous les changements.
- Avoir un “gros bouton rouge”.
- Les tests unitaires ne suffisent pas, des tests d’intégration sont également nécessaires.
- CANAUX DE COMMUNICATION ! ET CANAUX DE SECOURS !! ET DES SAUVEGARDES POUR CES CANAUX DE SECOURS !!!
- Modes de dégradation intentionnel des performances.
- Tester la résilience aux catastrophes.
- Automatisez vos mitigations.
- Réduisez le temps entre les déploiements, afin de diminuer la probabilité que le déploiement tourne mal.
- Une seule version matérielle globale est un point de défaillance unique.
Karpenter une évolution d’Autoscaler pour les clusters Kubernetes https://blog.ippon.fr/2023/11/07/mettez-a-lechelle-vos-clusters-kubernetes-de-maniere-efficace-et-faites-des-economies-avec-karpenter/
- Fonctionne uniquement pour AWS aujourd’hui, donc à voir la portabilité.
- Permet d’ajouter ou de supprimer des nœuds au cluster Kubernetes en dynamique pour rightsizer ses clusters.
- Bypass les API kube pour la creation d’instance et utilise les APIs AWS EC2 directement.
- Permet des nœuds hétérogènes (pas homogène comme Autoscaler).
- Et se rightsize rapidement (p. ex. 30s pour éteindre un nœud).
- Besoin d’applis cloud-natives, car elles vont être baladées.
Web
Deno ! https://www.infoq.com/news/2023/10/deno-jupyter-integration
- Dev experience, jupyter notebook integration.
- Améliorations sur Visual Studio Code extension (compatible avec NodeJS).
- L’exécution native sur Jupyter de Javascript et Typescript permet d’effectuer des analyses de données, construire des modèles d’apprentissage automatique et générer des rapports interactifs avec Deno.
- Visualisations dynamiques avec D3 dans le notebook.
- Connection à Deno KV.
- Plusieurs améliorations sur le testing, APIs etc
Lancement du nouveau site angular.dev et de la version v17 du framework https://blog.angular.io/announcing-angular-dev-1e1205fa3039
- Nouvelle doc, nouveaux tutoriels, et bac à sable.
- Un nouveau logo aussi.
- Mais cette version v17 est la continuation d’Angular, pas une toute nouvelle version qui casse tout.
- Le nouveau “control flow” devient GA, et propose des conditionals (
if
,else
…). - Le blog d’Angular mentionne les nouveautés, au-delà du revamp de la documentation.
- Cédric Exbrayat mets les mains dans le cambouis et couvre les nouveautés techniques dans le blog de Ninja Squad.
- Et les nouveautés aussi du côté de la CLI https://blog.ninja-squad.com/2023/11/09/angular-cli-17.0/.
- Beaucoup de focus sur l’apprentissage et la manipulation concrète avec le bac à sable et les tutoriels.
- Le site lui-même est maintenant open source (il ne l’était pas avant ?).
- Le logo est nouveau et adaptable par les communautés.
Outillage
Il est possible de signer et notariser des applications pour macOS sur des machines non-Apple https://gregoryszorc.com/blog/2022/08/08/achieving-a-completely-open-source-implementation-of-apple-code-signing-and-notarization/
- Implémenté en Rust.
- Pratique pour les pipelines CI/CD basés sur Linux.
- À priori, il y a des outils similaires pour le monde Windows, qui permet de signer sur une machine non-Windows : https://github.com/mtrojnar/osslsigncode.
Lors de son Github Universe, Copilot fait le show ! https://github.blog/2023-11-08-universe-2023-copilot-transforms-github-into-the-ai-powered-developer-platform/
- Copilot Chat sera GA en décembre, il utilise GPT4, il permet de guider le développeur, de générer du code, de détecter des erreurs et aide à les corriger, d’expliquer le code.
- Intégration à venir de Copilot Chat dans les IDEs de JetBrains.
- Copilot Chat va être intégré sur github.com et dans l’appli mobile aussi.
- Introduction de GitHub Copilot Enterprise pour les sociétés, qui permettra de spécialiser le modèle sur le code de l’entreprise.
- Intégration de Copilot ans Workspace, donc quand on voudra adresser un bug, créer un pull request, Copilot pourra nous aider étape par étape, suggérer un plan d’action.
- Copilot Enterprise permettra de faire des recherches avec le contexte entier du code de l’entreprise, donc idéalement meilleur que le focus sur un repo de Copilot.
Un guide sur OpenRewrite https://feeds.feedblitz.com/~/819402521/0/baeldung~A-Guide-to-OpenRewrite
- Permet de refactorer le code via des règles.
- Mise à jour des dépendances, enlever l’utilisation d’API dépréciées, migration d’une bibliothèque à une autre, etc.
- Migration Java, migration framework, transformations spécifiques à votre société.
- OpenRewrite vient avec un écosystème de recettes.
- Intégration via Maven ou Gradle.
- La suite montre des exemples de migrations.
Architecture
Article intéressant sur Monolithe vs Microservices ! https://www.infoq.com/articles/monolith-versus-microservices/
- Le débat monolithe vs microservices. Les monolithes reviennent, par exemple Spring Modulith.
- Les microservices sont la solution à la complexité plutôt que la cause de celle-ci. Toutes les applications deviendront complexes ; au-delà d’un certain point, les microservices nous aideront à gérer cette complexité.
- Les microservices comportent des coûts et des avantages. Si les avantages ne l’emportent pas sur les coûts, vous n’aurez pas une expérience positive avec les microservices.
- Nous pouvons arrêter notre transition vers les microservices quelque part au milieu du spectre, ce que j’aime appeler le modèle hybride. À ce stade, nous pouvons avoir quelques gros services mélangés à quelques petits services. Nous pouvons avoir le meilleur des deux mondes : la simplicité et la commodité du monolithe combinées à la flexibilité et à la scalabilité des microservices.
- Il n’y a pas de choix binaire entre monolithique et microservices. En réalité, il existe un spectre de possibilités entre les deux. Si vous vous êtes fixé à l’une des extrémités du spectre, vous passez à côté de la grande variété d’architectures intermédiaires.
- Nous devrions cesser de parler de monolithe contre microservices et plutôt avoir un débat plus nuancé sur la taille appropriée des services.
- Les microservices mettent sur le devant de la scene la complexification du système, les monolithes le cachent sous le tapis.
- Les microservices permettent de gérer cette complexité.
- Automatisation est la clé dans l’adoption des microservices.
- Bien aligner son architecture et son domain ou alors la douleur arrive.
Sécurité
Une explication de la CVE sur HTTP/2 https://quarkus.io/blog/cve-2023-44487/
- En fonction de l’implémentation, le risque est plus ou moins grand (de plus de CPU à un full DDOS).
- Au cœur du problème est la capacité d’envoyer pleins de requêtes en parallèle sur le meme pipeline HTTP/2.
- Les serveurs ont en général une limite aux streams en parallèle (genre 100).
- La CVE est exploitée côté client en ouvrant et fermant rapidement un stream, c’est plus léger sur le client, le serveur a un délai dans son processing.
- Ce qui permet de bypasser la limite et affamer les resources du serveur.
- C’est catastrophique en cas de one thread per request (thread starvation).
- En event loop, c’est une queue plus grande (donc le cas de quarkus).
- Pour mitiger, quarkus regarde le nombre de stream close requests par seconde pour détecter les abus (200 requêtes de fermeture sur une fenêtre de 30s).
Data / IA
Elon Musk annonce son LLM, appelé Grok https://x.ai/
- Connectivité en temps réel avec Twitter !
- Fenêtre de contexte de 25k characters.
- Le LLM garderait le contexte de la conversation (au lieu d’avoir à toujours renvoyer toute la discussion dans le contexte, à cause du côté sans état des LLMs habituellement).
- Le style, la personnalité, du LLM, serait assez humoristique, voire carrément sarcastique, à la Musk… et déjà sur Twitter une personne commentait en disant que c’était le LLM “anti-woke”.
- Grok serait disponible pour les utilisateurs payants de Twitter.
OpenAI fait 4 nouvelles annonces https://openai.com/blog/new-models-and-developer-products-announced-at-devday
- GPT-4 Turbo : leur dernier et plus puissant LLM. Il offre un contexte de 128k tokens, des prix plus bas et des quotas plus élevés. 128k c’est comme Claude.
- Assistants API : une solution permettant de créer des mini-assistants personnalisés et de les exposer via une API. L’objectif est de faciliter l’intégration des solutions GenAI dans les applications, avec des fonctionnalités de gestion des conversations, d’interprétation de code et de RAG.
- API pour DALL•E 3 : un modèle de 3e génération pour la génération d’images.
- GPTs : des versions personnalisées de ChatGPT, faciles à développer même sans compétences en programmation. Une place de marché sera disponible pour monétiser ces “GPTs”.
- Merci Didier et son X de résumer.
- Un article plus complet de SFEIR.
- Protection juridique en cas d’attaque de droits d’auteur.
Loi, société et organisation
Les acteurs et l’IA, deal pour arrêter la grève https://www.bbc.com/news/entertainment-arts-67364587
- Les acteurs et les grands studios d’Hollywood ont conclu un accord le 8 novembre pour mettre fin à une grève qui a paralysé la production de films et de séries aux États-Unis pendant plusieurs mois.
- L’accord prévoit une nouvelle convention collective de trois ans pour les acteurs (hormis les vedettes, les acteurs n’arrivent pas à gagner leur vie avec le streaming).
- Revalorisation importante des salaires minimums ainsi que des garde-fous contre l’IA. Un système de primes pour les rediffusions en streaming.
- Double mouvement social historique : les acteurs sont entrés en grève mi-juillet, les scénaristes depuis début mai. La paralysie du secteur a coûté au moins 6 milliards de dollars.
- Les acteurs craignaient que les studios utilisent l’IA pour cloner leur voix et leur image, les réutiliser à perpétuité, sans compensation ni consentement. Les conditions entourant les droits des studios sur l’image des acteurs stars après leur mort a été négocié.
Chute de WeWork, dépôt de bilan https://www.maddyness.com/2023/11/06/wework-impact-coworking-france/
- La disparition annoncée du géant mondial du coworking marque un tournant pour le secteur, y compris en France.
- Asphyxié par une dette de près de 3 milliards de dollars.
- Chute interminable entamée en 2019.
- WeWork était le leader mondial du secteur et un pionnier du coworking.
- WeWork propose 15 établissements en France, tous situés à Paris.
- Pourtant, la demande pour le coworking ne cesse d’exploser.
- Startups domicilient leur siège (Qonto par exemple) dans un espace de co-working.
- Le modèle du coworking n’est pas remis en cause. WeWork, c’est un phénomène à part. Il y a eu une mauvaise gestion de départ d’une licorne qui croît à toute vitesse, en ne faisant absolument pas attention à son modèle économique de base (dit Clément Alteresco, CEO de Morning).
- Mauvaise publicité pour le marché et les concurrents, qui considèrent qu’ils vont s’en sortir.
Les Français, les utilisateurs twitter le plus violents d’Europe? https://www.huffingtonpost.fr/france/article/les-francais-sont-les-utilisateurs-de-twitter-les-plus-violents-d-europe_225331.html
- Les signalements de contenus, suppressions et suspensions pour propos violents et haineux au sein de X sont les plus nombreux en France, loin devant l’Allemagne et l’Espagne.
- 16.288 suppressions de messages contre 7.160 en Allemagne et 7.743 en Espagne.
- X explique avoir une « équipe internationale et inter-fonctionnelle » de « modérateurs humains », qui travaillent « 24 heures sur 24 avec la capacité de couvrir plusieurs langues ».
Sam Altman PDG d’OpenAI est débarqué par son conseil de surveillance https://thealgorithmicbridge.substack.com/p/why-openai-fired-sam-altman-and-what
- Ça a surpris le monde la silicone valley dans lequel Altman est adulé.
- Un ancien cofondateur a aussi été écarté à un poste périphérique, mais a décidé de quitter le navire.
- C’est dû à des tensions dans la boîte entre la partie lucrative et non lucrative d’OpenAI.
- Le conseil travaille pour une AI sûre et pour le bien de l’humanité.
- Sam Altman avait fait prendre le virage for du business depuis quelques années.
- Il n’a selon le communiqué pas été franc et transparent avec son conseil de surveillance.
- Microsoft qui a misé sur ce cheval (OpenAI) n’était pas au courant, ni la plupart des employés d’OpenAI.
- Quelques employés de OpenAI ont déjà démissionné.
- La réduction des recherches fondamentales vs la productization a surement joué un rôle.
- Et il n’est pas le seul à partir
- Encore mieux que Dallas, le board négocie son retour au bout de 24h.
- Et le board saute
- Finalement, Satya Nadella annonce que Sam Altman et Greg Brockman rejoignent Microsoft dans une nouvelle équipe de recherche IA.
- Et finalement avec un nouveau board, Sam Altman retourne chez open AI.
Les groupes “Responsible AI” chez Google, Microsoft et plus récemment Meta sont détruits https://www.theverge.com/2023/11/18/23966980/meta-disbanded-responsible-ai-team-artificial-intelligence
- Même débat chez OpenAI en fait.
- Difficile de comprendre les raisons, à part que la course s’est accélérée.
- L’article cite les gouvernements qui veulent réguler, mais je ne comprends pas en quoi cela influence.
Conférences
Retrouvez les conférences sur le site Developers Conferences Agenda/List par Aurélie Vache.
Nous contacter
Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs
Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/
LCC 301 - Minoritaire ou majoritaire, là est la question!
Posté le 23/10/2023Dans cet épisode, Emmanuel et Guillaume reviennent sur les nouveautés de l’écosystème Java (Java 21, SDKman, Temurin, JBang, Quarkus, LangChain4J…) mais aussi sur des sujets plus généraux comme Unicode, WebAssembly, les bases de données vectorielles, et bien d’autres sujets orientés IA (LLM, ChatGPT, Anthropic…).
Enregistré le 20 octobre 2023
Téléchargement de l’épisode LesCastCodeurs-Episode-301.mp3
News
Langages
Gérer facilement de multiples versions de Java grâce à SDKMan! https://foojay.io/today/easily-manage-different-java-versions-on-your-machine-with-sdkman/
- SDKMan! supporte Java, mais aussi GraalVM, JBang, Quarkus, Micronaut… (les CLIs).
- La CLI UI est toujours un peu chelou, donc cet article est utile pour un rappel.
Tous les changements de Java 8 à Java 21 https://advancedweb.hu/a-categorized-list-of-all-java-and-jvm-features-since-jdk-8-to-21/
- Nous avons déjà partagé ce lien par le passé, mais l’article est mis à jour à chaque release majeure de Java pour couvrir les dernières nouveautés. Et en particulier, Java 21 qui vient de sortir.
Eclipse Temurin ne va pas sortir son Java 21 tout de suite https://adoptium.net/en-GB/blog/2023/09/temurin21-delay/
- Apparemment, une nouvelle licence pour le TCK (qui valide la compliance) doit être approuvée.
- Oracle semble avoir sorti de nouveaux termes, à quelques jours de la sortie officielle de Java 21.
- La mise à jour du TCK est arrivée le 9 octobre.
- Comment Microsoft a pu sortir le sien avant ?
Le Financial Times propose un bel article avec des animations graphiques expliquant le fonctionnement de l’architecture de réseau de neurones de type transformers, utilisé dans les Large Language Models https://ig.ft.com/generative-ai/
- LLM via relation entre les mots.
- Notion de transformer, qui parse les “phrases” entières ce qui capture le contexte.
- Discute le beam search vs greedy search pour avoir non pas le prochain mot, mais l’ensemble des prochains mots.
- L’article parle de texte/vector embeddings pour représenter les tokens et leurs relations aux autres.
- Il décrit le processus d’attention qui permet aux LLM de comprendre les associations fréquentes entre tokens
- Le sujet des hallucinations est couvert.
- Et pour éviter des hallucinations, utilisation du grounding.
The Absolute Minimum Every Software Developer Must Know About Unicode in 2023 https://tonsky.me/blog/unicode/
- Un bel article qui explique Unicode, les encodings comme UTF-8 ou UTF-16, les code points, les graphèmes, les problèmes pour mesurer une chaîne de caractères, les normalisations de graphèmes pour la comparaison de chaîne.
- Si vous voulez mieux comprendre Unicode, c’est l’article à lire !
- Unicode, c’est un mapping chiffre - caractère en gros.
- 1,1 million de caractères disponibles, dont 15% définis et 11% pour usage privé : il reste de la place. Et non les emojis ne prennent pas beaucoup de place.
- Par exemple Apple utilise les usages privés pour délivrer le logo Apple dans les fonts du Mac (mais pas ailleurs).
- UTF est l’encoding du chiffre de l’unicode.
- UTF-32: 4 bytes tout le temps, UTF-8, encodage variable de 1 à 4 bytes (compatible avec ASCII) ; il a aussi un peu de détection d’erreurs (prefix des bytes différents).
- Optimisé pour le latin et les textes techniques genre HTML.
- Problème principal : on ne peut pas déterminer la taille en comptant les bytes, ni aller au milieu d’une chaine directement (variable).
- UTF-16 utilise 2 ou plus de bytes et est plus sympa pour les caractères asiatiques.
- Un caractère, c’est en fait un graphème qui peut être fait de plusieurs codepoints : é =
e
U+0065 +´
U+0301 ;☹️
(smiley qui pleure) isU+2639
+U+FE0F
. - D’ailleurs selon le langage
":man-facepalming::skin-tone-3:".length = 5
, 7 en java, 17 en rust ou 1 en swift. Ça dépend de l’encodage de la chaine (UTF-?). - ““I know, I’ll use a library to do strlen()!” — nobody, ever.”
- En java, utiliser ICU.
- Attention
java.text.BreakIterator
supporte une vieille version d’Unicode, donc ce n’est pas bon. - Les règles de graphème changent à chaque version majeure d’Unicode (tous les ans).
- Certains caractères comme
Å
ont plusieurs représentations d’encodage, donc il y a de la normalisation : NFD qui éclate en pleins de codepoints ou NDC qui regroupe au max. - Normaliser avant de chercher dans les chaines.
- Certains Unicode sont représentés différemment selon la LOCALE (c’est la life).
- Et ça continue dans l’article…
JBang permet d’appeler Java depuis Python via un PyPI https://jbang.dev/learn/python-with-jbang/
- C’est particulièrement intéressant pour appeler Java depuis son Jupyter notebook.
- Ça fait un appel à un autre process (mais installe JBang et Java au besoin).
Librairies
Quarkus 3.4 est sorti https://quarkus.io/blog/quarkus-3-4-1-released/
- Un CVE donc mettez a jour vos Quarkus.
- Support de Redis 7.2.
- Plus de granularité sur la désactivation de Flyway globalement ou par data source. Depuis l’activation transparente et automatique en 3.3.
quarkus update
est l’approche recommandée pour mettre à jour.
Comment tester si un thread virtuel “pin” https://quarkus.io/blog/virtual-threads-3/
- Exemple avec quarkus.
- Comment générer la stacktrace.
- Et un utilitaire JUnit qui fait échouer le test quand le thread pin.
- Une série d’articles de Clement sur les threads virtuels et comment les utiliser dans quarkus https://quarkus.io/blog/virtual-thread-1/.
À la découverte de LangChain4J, l’orchestration pour l’IA générative en Java https://glaforge.dev/posts/2023/09/25/discovering-langchain4j/
- Guillaume nous parle du jeune projet LangChain4J, inspiré du projet Python LangChain, qui permet d’orchestrer différents composants d’une chaine d’IA générative.
- Grâce à ce projet, les développeurs Java ne sont pas en reste, et n’ont pas besoin de se mettre à coder en Python.
- LangChain4J s’intègre avec différentes bases vectorielles comme Chroma ou WeAviate, ainsi qu’une petite base en mémoire fort pratique.
- LangChain4J supporte l’API PaLM de Google, mais aussi OpenAI.
- Il y a différents composants pour charger/découper des documents et pour calculer les vector embeddings des extraits de ces documents.
- Vidéo enregistrée à Devoxx sur ce thème : https://www.youtube.com/watch?v=ioTPfL9cd9k.
Infrastructure
OpenTF devient OpenTofu https://www.linuxfoundation.org/press/announcing-opentofu
Dans les Dockerfiles, on peut utiliser la notation “heredocs” : <<EOF
, des commandes, puis EOF
pour indiquer une suite de commandes à exécuter
https://www.docker.com/blog/introduction-to-heredocs-in-dockerfiles/
- C’est comme faire un seul
RUN
avec des commandes séparées par des&&
, mais en plus sympa parce que ça ressemble à un script Bash classique. - Par contre, c’est spécifique Docker et ça n’est pas portable sur Podman ou autre.
Docker annonce un nouveau protocole pour signer ses images OpenPubkey https://www.linuxfoundation.org/press/announcing-openpubkey-project
- Sigstore répond : https://blog.sigstore.dev/openpubkey-and-sigstore/.
- OpenPubkey s’appuie sur OIDC.
- C’est un repo GitHub pour l’instant.
- Pas de tier de confiance en dehors du OIDC provider.
- OIDC lie une identité à une clé de chiffrement via une extension de l’ID token.
- OIDC devient une preuve de possession.
- Purement client side via la signature de l’ID token.
- Ils utilisent le
nonce
pour stocker la clé publique et la signer cryptographiquement. - Vs Sigstore : plus d’élément central comme le transparency log et l’autorité de certification.
- Pour le projet Sigstore, ils n’ont pas utilisé cette architecture parce que la privacy des identités, notamment en cas de renommage et sur le long terme, n’est pas respectée.
- La rotation de clés et la partie client side devient beaucoup plus complexe (OIDC quoi) et ouvre des risques de sécurité (bugs d’implémentation).
- La clé des OIDC providers est rotatée et ce n’est pas expliqué dans le flow OpenPubkey.
- La complexité passe de server side à client side (vu que le nonce est la clé du système).
- Le client notamment va devoir tracker les clés de signature des providers OIDC tout le temps (ou un système devra le faire).
- L’ID token typiquement a plus d’infos qui vont leaker en tant que certificat du truc signé (privacy).
Cloud
Oracle Cloud rajoute GraalOS https://blogs.oracle.com/java/post/introducing-graalos
- Plateforme serverless sans container.
- Application native.
- En fait des applis compilées avec GraalVM native image.
Web
Comment créer le plus petit conteneur qui sert du contenu statique https://lipanski.com/posts/smallest-docker-image-static-website
- En utilisant les images Busybox.
- On peut descendre à environ 150 Ko.
- À voir la scalabilité.
- Et les CVEs.
The state of WebAssembly in 2023 https://blog.scottlogic.com/2023/10/18/the-state-of-webassembly-2023.html
- Rust et JavaScript voient leur popularité lorsqu’ils ciblent Wasm.
- Wasm est toujours beaucoup utilisé pour le développement web, mais aussi pour le serverless ou comme host pour système de plugins.
- L’étude montre que les développeurs sont intéressés par les threads, le garbage collection et le nouveau modèle de composants.
- Côté WASI, toutes les propositions sur le thème I/O retiennent l’attention comme : le support de HTTP, du filesystem, ou les sockets… pourtant, c’est ce que l’approche WASIX proposait, même si elle n’a pas été très bien reçue par la communauté.
Data & IA
AWS investit 4 milliards dans Anthropic.ai et devient actionnaire minoritaire https://twitter.com/didiergirard/status/1706226172428701896?s=61&t=cvEVELchNh1NmF0qxg2GgA
- Depuis quelque temps, beaucoup de personnes se demandaient où en était AWS dans le domaine GenAI. La réponse vient de tomber.
- Plutôt que de développer sa propre technologie comme le fait Google, Amazon adopte la stratégie de Microsoft avec OpenAI en investissant dans un pure player et en lui fournissant de la puissance de calcul.
- AWS deviendra le principal fournisseur cloud d’Anthropic, en fournissant son infrastructure à base de puces AWS Trainium et Inferentia.
- La technologie d’Anthropic sera ajoutée au catalogue d’Amazon Bedrock. Les entreprises pourront personnaliser et affiner les modèles sur AWS.
- Claude 2 propose une fenêtre contextuelle de 100 000 tokens, que les entreprises pourront utiliser.
- Dans le cadre de cet investissement, Amazon acquiert une participation minoritaire dans @AnthropicAI. La structure de gouvernance d’Anthropic reste inchangée.
- L’annonce : https://www.anthropic.com/index/anthropic-amazon.
- Merci Didier Girard pour ce résumé.
Article d’opinion : les bases de données vectorielles ne sont pas une catégorie de base de donnée séparée https://nextword.substack.com/p/vector-database-is-not-a-separate
- On a vu l’émergence de nouvelles bases de données de type vectoriel ces deux dernières années : Pinecone, Milvus, Weaviate, Qdrant…
- Mais les DB existantes sont toutes en train de rajouter le support des vecteurs dans leur moteur.
- Pour la “data gravity” : c’est plus facile d’avoir ses données au même endroit que d’en avoir dans différentes bases malgré leur corrélation.
- Pour capturer le use case de “Retrieval Augmented Generation”, en utilisant les Large Language Model pour récupérer de l’info dans ces bases de données vectorielles.
- Je pense qu’on verra aussi les DB vectorielles ajouter également plus de fonctionnalités de requêtage qui leur manquent.
Chat GPT: voix et image https://openai.com/blog/chatgpt-can-now-see-hear-and-speak
- OpenAI a annoncé de nouvelles fonctionnalités vocales et d’image pour ChatGPT.
- OpenAI a publié un article décrivant leurs efforts de test avec GPT-4V. Ils ont utilisé le modèle dans un outil appelé Be My AI, qui aide les personnes malvoyantes en décrivant le contenu des images : https://cdn.openai.com/papers/GPTV_System_Card.pdf.
- L’article résume l’évaluation du modèle GPT-4V par OpenAI, qui inclut des tests de comportement, de sécurité, et de capacité médicale, mais conclut que le modèle n’est pas approprié pour des fonctions médicales.
L’IA, c’est pas rentable https://www.tomshardware.com/news/microsoft-lost-money-on-ai
- Copilot dépense 20$ par utilisateur qui ramène 10$.
- Il va donc y avoir de la rationalisation après l’acquisition rush d’utilisateurs.
- En augmentant les prix.
- En mettant des limites plus restrictives.
- En utilisant des modèles plus simples et plus légers.
- Peut-être avec du hardware plus optimisé en coût.
- C’est intéressant que l’IA est déjà trop puissante pour son coût et pas encore assez pour être suffisante. Loi de Moore ?v
- MS dit que ce chiffre est faux, mais ne donne pas le vrai chiffre.
Outillage
Amazon acquiert Fig https://techcrunch.com/2023/08/29/amazon-fig-command-line-terminal-generative-ai/
- On en parlait récemment.
- C’est un terminal boosté à l’IA.
Introduction de TestContainer Desktop https://www.infoq.com/news/2023/09/testcontainers-desktop/
- Vient de l’appli proprio TestContainer Cloud Desktop.
- Permet de mettre les ports fixes (plus facile à debugger).
- Le gel des containers pour laisser le container tourner pour l’inspection
- Supporte les moteurs de containers alternatifs à Docker (dont Podman et d’autres que je ne connaissais pas).
Nouvelle version 1.7 de jq, l’outil en ligne de commande pour examiner/modifier vos documents JSON https://github.com/jqlang/jq/releases
- Utilisation des nombres décimaux pour ne pas perdre de précision.
- Une fonction
pick(stream)
pour faire des projections et ne garder que les champs qui nous intéressent. - Une fonction debug() pour loguer des messages sur
stderr
. - Une fonction abs() pour calculer la valeur absolue.
- Et plein d’autres petits raffinements et correctifs de bugs.
- La version d’avant datait de novembre 2018.
Pratiques de Dogfooding : utiliser tes propres outils comme GitHub utilise GitHub actions pour son propre système CI https://www.infoq.com/news/2023/10/running-GitHub-using-actions/
- Avoir des runners plus larges.
- Donner l’accès à des resources privées au runner via une gateway qui reçoit un token OIDC specific au runner.
- Workflow réutilisables.
- Sortie de workflows réutilisables pour optimiser si le git id est le même qu’un run ancien.
Sondage de la communauté TestContainer https://www.atomicjar.com/2023/09/state-of-local-development-and-testing-2023/
- TestContainer pour plus de 10 languages, pas juste Java.
- RDBMS puis message brokers et les bases nosql sont la majorité des usages.
- Mais pas que (serveur web, émulateur de cloud, microservices internes).
- 40% des utilisateurs utilisent autre chose que Docker Desktop (docker engine, podman, rancher etc).
- TestContainer au moment du dev et pas que pour les tests.
Architecture
Vous êtes plutôt logging ou plutôt tracing ? https://andydote.co.uk/2023/09/19/tracing-is-better/
- L’article essaie de démontrer que le tracing, c’est mieux que le logging.
- L’imbrication des traces permet de mieux voir la corrélation que des logs.
- Les traces donnent des informations de durées, pas que des timestamp.
- On peut rajouter des attributs à ses traces, ce qui rend plus facile le requêtage, plutôt que de faire des greps sur des messages de log.
Méthodologies
On a construit un produit top et ça a échoué Earthly.dev raconte https://earthly.dev/blog/shutting-down-earthly-ci/
- Outil de CI/CD qui évite de répéter les tâches…
- Comme startup, tu ne releases pas un produit mature et complet en fonctionnalités.
- Mais peut-être 10x meilleur sur une chose spécifique qui peut faire oublier les manques à certains.
- Quand tu captures ces premiers, tu investis et étends, et tu répètes.
- Si au début ce différenciateur n’attire personne, ajouter des features ne va pas aider, c’est une recette pour construire quelque chose que personne ne veut.
- Ils ont construit leur plan de domination en étapes indépendantes, des produits plus focalisés.
- Et le premier produit “gratuit” ne cannibalisait pas les seconds produits, car ils adressaient différents problèmes (donc pas de risque sur le business model).
- Le premier produit construit par une personne a été beaucoup adopté.
- Le deuxième (remote workers) a aussi été adopté avec des gens qui faisaient en DIY, et quand ils ont fait une offre managée, les gens sont venus.
- Les CI traditionnelles lançaient le job et le reste était délégué à Earthly et Earthly Satellites (le cœur du build).
- Il ne restait plus qu’à allumer le troisième étage Earthly CI, mais c’est parti en cacahuete.
- La population intéressée n’était pas des fans qui avaient déjà fait le job du produit, ils demandaient en quoi la CI était différente, le coût de migration et ils n’ont jamais pu gagner.
- Au lieu d’une grass root install, il y avait un long mur de migration à passer.
- La clé, c’est que vendre aux devs avec un GTM direct ne marche pas, ils doivent essayer et adopter par eux-mêmes.
- Les développeurs vont acheter un outil de dev, mais tu ne peux pas leur vendre.
horcrux https://github.com/jesseduffield/horcrux
- Permet de chiffrer un fichier en plusieurs morceaux, et il faut avoir un certain nombre de fragments pour rassembler le fichier entier.
- Ne nécessite aucun mot de passe.
Sécurité
Des pseudos chercheurs en sécurité utilisent Bard pour reporter un CVE pour le projet cURL https://hackerone.com/reports/2199174
- Heureusement, Daniel Steinberg (le créateur de cURL) et les mainteneurs du projet ont rapidement détecté la supercherie.
- Les LLMs sont super créatifs : ils ont déjà vu dans leur corpus d’entrainement des pages de CVE, et sont donc capables d’en imaginer aussi !
- Mais imaginez le temps perdu par les mainteneurs de projet OSS s’ils doivent du coup perdre leur temps à vérifier de telles inepties ?
- Au nez et à la Bard de l’IA.
Loi, société et organisation
Cisco achète Splunk pour 28 milliards https://techcrunch.com/2023/09/21/cisco-to-acquire-splunk-in-28b-mega-deal/
- Bouge cisco plus dans le software.
- “synergétique”.
- Objectif : un géant de l’observabilité et la sécurité.
- Avec de l’IA parce que c’est comme ça qu’on justifie ces achats.
- Cet achat doit encore être validé par les autorités de concurrence.
- Quelque part en 2024.
Les fondations comme Eclipse ont peur du Cyber Résilience Act Européen tel que présenté jusqu’à présent https://newsroom.eclipse.org/news/announcements/cra-should-support-open-practices-open-source-and-development-european-open
- Ils demandent une clarification sur les contraintes réglementaires.
- Notamment d’exclure les fondations / associations et laisser le poids sur les sociétés qui fourniraient les projets open sources des fondations dans le cadre d’un accord commercial, pas juste de le fournir en téléchargement.
- Réutiliser la validation de compliance des sociétés commerciales par les fondations.
- Autre article de la linux foundation : https://www.linuxfoundation.org/blog/understanding-the-cyber-resilience-act.
- Fourniture de matchs, auditing, fournir des mises à jour.
- Bouge la responsabilité de l’utilisateur vers le développeur du logiciel.
- Un individu qui ne reçoit pas de contribution ni ne fait de consulting ⇒ exclu.
- Fondations et sociétés commerciales ⇒ inclues.
- Défini des classes de logiciels de non critique à classe 1 et 2.
- Doit faire un risk assessment avant de livrer (pas de bug de sécurité, secure par défaut, security update).
- De la doc sur le process d’évaluation des risques et un SBOM notamment.
- Notifier d’une vulnérabilité en moins de 24h.
- Il y a une campagne : #FixTheCRA.
Des protestations contre l’ouverture des modèles d’IA de Meta https://spectrum.ieee.org/meta-ai
- Ouvrir les modèles et leurs poids permet aux acteurs de bypasser les restrictions (biais etc).
- Donc des gens de Meta protestent contre la politique open source de Meta dans ce domaine.
- L’argument, c’est qu’un modèle derrière une API peut être éteint.
- Les partisans de l’avis contraire pointent que contourner les restrictions de ChatGPT a été trivial jusqu’à présent.
- Et que l’obscurité amène à un déficit de transparence, de connaissance du public.
- Va affecter les chercheurs indépendants.
- Cela dit, ce n’est pas de l’open source pur, car les sources et comment le modèle est entrainé est peu publié.
- L’OSI travaille à une définition d’Open Source AI.
Un site pour mettre une pause à l’IA https://pauseai.info/
- NOUS RISQUONS DE PERDRE LE CONTRÔLE
- NOUS RISQUONS L’EXTINCTION DE L’HUMANITÉ
- NOUS AVONS BESOIN D’UNE PAUSE
- NOUS DEVONS AGIR IMMÉDIATEMENT
- Il y a un agenda des manifestations à travers le monde (Londres, Bruxelles, SFO… mais où est Paris ?).
- Twitter/Discord/Facebook/TikTok/LinkedIn.
- Alors qui va gagner la course à l’extinction de l’humanité ? La guerre, le réchauffement climatique ou l’IA ?
- Sarah Connor !!!
Outils de l’épisode
Un QWERTY adapté pour les lettres à accent https://altgr-weur.eu/ (via Thomas Recloux)
Conférences
Toutes les vidéos de Devoxx Belgique sont disponibles sur https://www.youtube.com/@DevoxxForever.
Hacktoberfest, édition 10 https://hacktoberfest.com/.
La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :
- 26 octobre 2023 : Codeurs en Seine - Rouen (France)
- 26-27 octobre 2023 : Agile Tour Bordeaux - Bordeaux (France)
- 26-29 octobre 2023 : SoCraTes-FR - Orange (France)
- 30-31 octobre 2023 : Asynconf Event - Paris (France) & Online
- 2-3 novembre 2023 : Agile Tour Nantes - Nantes (France)
- 3 novembre 2023 : XCraft - Lyon (France)
- 7 novembre 2023 : DevFest Sophia-Antipolis - Sophia-Antipolis (France)
- 10 novembre 2023 : BDX I/O - Bordeaux (France)
- 15 novembre 2023 : DevFest Strasbourg - Strasbourg (France)
- 16 novembre 2023 : DevFest Toulouse - Toulouse (France)
- 18-19 novembre 2023 : Capitole du Libre - Toulouse (France)
- 23 novembre 2023 : DevOps D-Day #8 - Marseille (France)
- 23 novembre 2023 : Agile Grenoble - Grenoble (France)
- 30 novembre 2023 : PrestaShop Developer Conference - Paris (France)
- 30 novembre 2023 : WHO run the Tech - Rennes (France)
- 6-7 décembre 2023 : Open Source Experience - Paris (France)
- 6-8 décembre 2023 : API Days Paris - Paris (France)
- 7 décembre 2023 : Agile Tour Aix-Marseille - Gardanne (France)
- 7-8 décembre 2023 : TechRocks Summit - Paris (France)
- 8 décembre 2023 : DevFest Dijon - Dijon (France)
- 31 janvier 2024-3 février 2024 : SnowCamp - Grenoble (France)
- 1 février 2024 : AgiLeMans - Le Mans (France)
- 15-16 février 2024 : Touraine Tech - Tours (France)
- 6-7 mars 2024 : FlowCon 2024 - Paris (France)
- 14-15 mars 2024 : pgDayParis - Paris (France)
- 19-22 mars 2024 : KubeCon + CloudNativeCon Europe 2024 - Paris (France)
- 28-29 mars 2024 : SymfonyLive Paris 2024 - Paris (France)
- 17-19 avril 2024 : Devoxx France - Paris (France)
- 18-20 avril 2024 : Devoxx Greece - Athens (Greece)
- 25-26 avril 2024 : MiXiT - Lyon (France)
- 25-26 avril 2024 : Android Makers - Paris (France)
- 8-10 mai 2024 : Devoxx UK - London (UK)
- 24 mai 2024 : AFUP Day Nancy - Nancy (France)
- 24 mai 2024 : AFUP Day Poitiers - Poitiers (France)
- 24 mai 2024 : AFUP Day Lille - Lille (France)
- 24 mai 2024 : AFUP Day Lyon - Lyon (France)
- 6-7 juin 2024 : DevFest Lille - Lille (France)
- 19-20 septembre 2024 : API Platform Conference - Lille (France) & Online
- 7-11 octobre 2024 : Devoxx Belgium - Antwerp (Belgium)
- 10-11 octobre 2024 : Volcamp - Clermont-Ferrand (France)
Nous contacter
Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs
Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/
LCC 300 - Interview de Jean-Michel Doudoux sur Java 21 par Charles Sabourdin
Posté le 18/09/2023Dans cet épisode Charles Sabourdin interview Jean-Michel Doudoux sur la sortie de la nouvelle version LTS de Java en 2023 : Java 21.
Enregistré le 5 septembre 2023
Téléchargement de l’épisode LesCastCodeurs-Episode-300.mp3
Java 21
The art of long-term support and what LTS means for the Java ecosystem
JDK 21
- 444: Virtual Threads
- 453: Structured Concurrency (Preview)
- 446: Scoped Values (Preview)
- 440: Record Patterns
- 441: Pattern Matching for switch
- 430: String Templates (Preview)
- 443: Unnamed Patterns and Variables (Preview)
- 445: Unnamed Classes and Instance Main Methods (Preview)
- 431: Sequenced Collections
- 439: Generational ZGC
- 451: Prepare to Disallow the Dynamic Loading of Agents
- 452: Key Encapsulation Mechanism API
- 442: Foreign Function & Memory API (Third Preview)
- 448: Vector API (Sixth Incubator)
- 449: Deprecate the Windows 32-bit x86 Port for Removal
À propos de Jean-Michel Doudoux
À propos de ParisJug
Nous contacter
Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs
Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/
LCC 299 - Katia est dans la place !
Posté le 11/09/2023Dans cet épisode de rentrée, Antonio et Arnaud ont le plaisir d’accueillir Katia Aresti dans l’équipe. Ils passent en revue les dernières nouveautés et sujets chauds de cette rentrée, notamment la sortie de Java 21, les nouvelles versions de Quarkus, Micronaut, Hibernate, NodeJS, Redis, et bien d’autres encore. Ils discutent de sujets plus généraux tels que l’observabilité, la nouvelle tendance “Platform Engineering”, et la productivité des développeurs. Ils abordent aussi les sujets sur la sécurité, tels que les failles sur les CPUs Intel et AMD, ainsi que la vie privée, avec les Tracking APIs de Chrome, Firefox et le projet de loi SREN. Le tout est agrémenté de sa dose d’IA, avec des librairies telles que Semantic Kernel, ainsi que des sujets plus haut niveau tels que Google Gemini, Meta GPT, LLama 2, et les biais et la consommation énergétique de l’IA.
Enregistré le 8 septembre 2023
Téléchargement de l’épisode LesCastCodeurs-Episode-299.mp3
News
Langages
Apache Groovy a 20 ans! https://twitter.com/ApacheGroovy/status/1695388098950217909
- L’annonce du lancement du projet par James Strachan https://web.archive.org/web/20030901064404/http://radio.weblogs.com/0112098/2003/08/29.html.
- Le projet a depuis énormément évolué et après plusieurs vies a été adopté par la fondation Apache en 2015.
Java 21 arrive le 19 septembre https://www.infoworld.com/article/3689880/jdk-21-the-new-features-in-java-21.html
- C’est la nouvelle LTS.
- Pas mal de nouvelles fonctionnalités comme les virtual threads, le pattern matching sur les switch, sequenced collections…
- Retrouvez le 19 septembre une interview de Jean-Michel Doudoux par Charles Sabourdin pour l’épisode 300 des Cast Codeurs !
Librairies
Semantic Kernel pour Java est (en train de) sortir : https://devblogs.microsoft.com/semantic-kernel/introducing-semantic-kernel-for-java/
- Framework OSS pour faire de l’IA.
- .Net et Python.
- Java 0.2.7 Alpha est publié.
- Kernel car il est tout petit.
- Se connecte à plusieurs fournisseurs (aujourd’hui OpenAI, Azure AI, Hugging Face), plusieurs DB vectorielles, plusieurs templates de prompt (suit la specification de OpenAI).
OpenSSL : qui committe ? https://www.openssl.org/blog/blog/2023/07/17/who-writes-openssl/
- En majorité des OSS payés.
- Puis des gens payés par leur boite.
- Et enfin des contributeurs non payés.
- c’est rapide, mais ça montre que depuis heartbleed, ça a changé
Micronaut 4.1.0 https://micronaut.io/2023/09/01/micronaut-framework-4-1-0-released/
- Bean Mappers pour créer automatiquement une correspondance entre un type et un autre.
- Un Introspection Builder : l’annotation
@Introspected
pour générer un builder dynamique si un type ne peut être construit que via un modèle builder. - Améliorations pour les développeurs utilisant Kotlin Symbol Processing (KSP).
Quarkus 3.3.1 / 3.3.2
- Pas mal de fixes :
- Il est important de noter qu’un problème de dégradation des performances et de la mémoire a été introduit dans Quarkus 3.3. Ce problème est corrigé dans Quarkus 3.3.2.
Hibernate ORM 6.3.0 et 6.2.8 et Hibernate Reactive 2.0.5 https://hibernate.org/orm/
- Un support initial de la spécification Jakarta Persistence 3.2.
- Un nouveau guide d’introduction Hibernate 6, un nouveau guide de syntaxe et de fonctionnalités pour le langage de requête Hibernate (Hibernate Query Language).
- Annotation @Find sur des méthodes → créer des méthodes de recherche similaires aux méthodes de requête.
- Reactive compatible avec Hibernate ORM 6.2.8, certains changements d’API.
Infrastructure
Une série d’articles sur l’observabilité par Mathieu Corbin
- Les articles :
- L’auteur reprend les bases sur l’observabilité :
- Qu’est-ce qu’une métrique ? Les labels, les cardinalités.
- Les types de métriques (Compteurs, jauges, quantiles et histogrammes).
- C’est quoi le tracing ?
- Traces, Spans, Resources, Scopes qu’est-ce que c’est ?
- Les Events pour remplacer les logs ?
Web
NodeJS 20.6.0 est disponible et ajoute le support des fichiers .env
https://philna.sh/blog/2023/09/05/nodejs-supports-dotenv/
- Configurable avec l’option
--env-file
. - Le fichier
.env
peut contenir des variables d’environnement et commentaires#
. - Attention par contre : pas de lignes multiples ni d’extension de variables.
- Vous pouvez par exemple configurer
NODE_OPTIONS
avec ce système.
Data
Redis 7.2 est sorti ! https://redis.com/blog/introducing-redis-7-2/
- Auto-tiering : cette nouvelle fonctionnalité permet de stocker les données sur des supports de stockage différents, en fonction de leur importance et de leur fréquence d’accès. Cela permet d’améliorer les performances et la scalabilité de Redis.
- RESP3 : cette nouvelle version du protocole RESP permet une communication plus efficace entre Redis et les clients.
- Improvements to performance : de nombreuses améliorations de performances ont été apportées à Redis 7.2, notamment pour les opérations de lecture et d’écriture.
- New commands : plusieurs nouvelles commandes ont été ajoutées à Redis 7.2, notamment :
CLIENT NO-TOUCH
: cette commande permet d’empêcher un client d’être touché par une opération AOF ou RDB.WAITAOF
: cette commande permet d’attendre que l’AOF soit écrite avant de poursuivre l’exécution.
- Dans le podcast sont cités les hot replacement de Redis, comme Dragonfly.
Architecture
Article sur Google Gemini et sa capacité à battre ChatGPT https://www.semianalysis.com/p/google-gemini-eats-the-world-gemini
- Google a raté les premiers pas (ils avaient le meilleur LLM public avant ChatGPT 3).
- Et les chercheurs qui inventent les champs de LLMs.
- Google va 5x ChatGPT-4 avant la fin de l’année, mais vont-ils les publier ?
- Les chercheurs se tirent la bourre sur le nombre de GPU (H100) auxquels ils ont accès ; ce sont les grosses organisations comme Meta, OpenAI et Google.
- Et les autres qui luttent avec des GPUs qui n’ont pas assez de VRAM et ce qu’ils vont faire c’est de la merde et sans consequence.
- Le peuple utilise le modèle dense de LLAMA mais, pour les environnements contraints, ça serait mieux des sparse models et du speculative decoding.
- Ils devraient se concentrer sur la performance de modèle qui utilise plus de compute et mémoire en évitant de consommer de la bande passante de memoire, c’est ce dont l’edge computing a besoin.
- Les benchmarks publics ne mesurent pas des choses utiles.
- Même HuggingFace est dans la category des GPU-poor.
- Nvidia est en train de se construire une machine de guerre (service).
- La Chine et les US vont être en compétition, mais l’Europe qui reste GPU-poor ne va pas s’en sortir.
- Les startups ne peuvent pas payer les GPUs en action, il faut du cash.
- Tout le monde rempli les poches de Nvidia, sauf Google.
- Google grossi exponentiellement ses propres GPUs.
Meta GPT https://www.infoq.com/news/2023/08/metagpt-agent-collaboration/
IA : biais et durabilité par Leslie Miley, tech advisor du CTO de Microsoft https://www.infoq.com/presentations/ai-bias-sustainability
- Nouvelles infrastructures.
- La consommation énergétique et d’eau des datacenters pour l’IA est terriblement élevée.
- L’impact des infrastructures sur les communautés (bruit).
- Explique bien son point de vue sur les problèmes d’amplification des biais de l’IA.
- Propose des stratégies pour atténuer l’impact.
Kubeflow, le toolkit pour deployer machine learning (ML) workflow en Kubernetes, est accepté par la CNCF https://www.infoq.com/news/2023/08/kubeflow-cncf-project
Méthodologies
Measuring developer productivity? A response to McKinsey by Kent Beck and Gergely Orosz (pragmaticengineer.com) https://tidyfirst.substack.com/p/measuring-developer-productivity
- McKinsey a sorti un article où ils expliquent la recette miracle recherchée par tous les managers comme le graal : Comment mesurer la productivité des développeurs ? (faut bien vendre du conseil)
- Kent et Gergely partent d’un modèle mental de description de la création de valeur par le développeur pour ensuite voir quels sont les besoins de mesurer la productivité et comparent cela avec d’autres secteurs (la vente, le support, le recrutement).
- Ils concluent cette première partie avec les compromis à faire pour que ce type de mesures ait un intérêt sans impacter trop négativement les développeurs.
- Un autre article dans la même lignée par Martin Fowler : https://martinfowler.com/bliki/CannotMeasureProductivity.html.
Et si on parlait de Platform Engineering ?
- Quelques articles :
- DevOps vs. SRE vs. Platform Engineering (humanitec.com)
- What is platform engineering? (gartner.com) / What is platform engineering? (platformengineering.org)
- Internal Developer Platform
- Cognitive load
- Team topologies
- Engineering Effectiveness (thoughtworks.com) and Maximize your tech investments with Engineering Effectiveness (thoughtworks.com)
- Ces différents articles retracent la genèse du concept de Platform Engineering.
- L’activité de Platform Engineering vient en réponse à la charge cognitive rajoutée aux équipes techs dans des transitions DevOps loupées (You build it, you run it… et vous vous débrouillez).
- Cela conduit à la création de golden paths et d’une Internal Developers Platform qui doit proposer en interne les services nécessaires aux équipes pour livrer leurs produits le plus efficacement possible tout en suivant les critères de qualité et de compliance de l’entreprise.
- Pour en savoir plus, une table ronde à laquelle Arnaud a participé en juillet : https://youtu.be/N-tN7HUA4No?si=2P0wSqG32MLWUlGq.
On call Process (Astreinte), startup TinyBird par VP Engineering Félix López (ex google, ex eventbrite) https://thenewstack.io/keeping-the-lights-on-the-on-call-process-that-works/
- Si votre produit est SAAS, on doit avoir des astreintes. Cela impose un lourd fardeau à ceux qui doivent être en astreinte, surtout en petite entreprise.
- Petites entreprises évitent avoir un processus d’astreinte formel pour éviter le stress. Cela crée dans la pratique plus de stress : si personne n’est responsable, tout le monde est responsable.
- Tinybird est la plateforme de données en temps réel pour les développeurs et les équipes de données. Pré-création du process formel chez Tinybird : désorganisé, non structuré et stressant.
- Mise en place : Principes fondamentaux d’un processus d’astreinte : L’astreinte n’est pas obligatoire, minimiser le bruit, pas seulement pour les SRE, alert = runbook, avoir des backups pour la personne en astreinte, appeler quelqu’un devrait être la dernière solution, minimiser le temps en astreinte.
- L’article explique comment ils sont passés de regarder chaque alerte (comprehensible ?, exploitable ?), puis avoir un board grafana pour chacune et plan spécifique. Une fois le tri fait, tout migré vers un seul channel de com, et manuel d’astreinte pour chaque alerte. Itérer.
- Multiples benefices sur le long terme : rapports d’incident ouvert, atténuer les problèmes futurs, renforcement la propriété et les connaissances du code et systèmes au sein de toute l’équipe…
Sécurité
Downfall, une nouvelle faille de sécurité sur les processeurs Intel (https://www.lemondeinformatique.fr/actualites/lire-la-faille-downfall-met-a-mal-des-milliards-de-processeurs-intel-91247.html) et AMD ne fait pas mieux avec une faille nommée Inception (https://www.lemondeinformatique.fr/actualites/lire-les-puces-amd-vulnerables-a-la-faille-inception-91273.html)
- Downfall, La vulnérabilité est due à des fonctions d’optimisation de la mémoire dans les processeurs Intel qui révèlent involontairement les registres matériels internes aux logiciels. Cela permet à des logiciels non-fiables d’accéder à des données stockées par d’autres programmes, qui ne devraient normalement pas être accessibles. Tous les PC ou ordinateurs portables équipés de processeurs Intel Core de la 6e génération Skylake jusqu’aux puces Tiger Lake de 11e génération incluses contiennent cette faille. Les derniers processeurs Core 12e et 13e génération d’Intel ne sont pas concernés.
- Inception, nécessite un accès local au système pour être potentiellement exploité ce qui en limite de fait la portée. Tous les processeurs AMD depuis 2017 sont touchés, incluant les derniers modèles Zen 4 Epyc et Ryzen.
Comment désactiver le nouveau tracking publicitaire ciblé sur Chrome https://www.blogdumoderateur.com/chrome-comment-desactiver-tracking-publicitaire-cible/
- Google a annoncé en juillet le déploiement de sa nouvelle API Topics, permettant « à un navigateur de partager des informations avec des tiers sur les intérêts d’un utilisateur tout en préservant la confidentialité ».
- C’est cette API, incluse dans la version Chrome 115 de juillet 2023, qui est censée remplacer les cookies tiers.
Loi, société et organisation
Une nouvelle definition d’open pour Llama 2 ? https://opensourceconnections.com/blog/2023/07/19/is-llama-2-open-source-no-and-perhaps-we-need-a-new-definition-of-open/
- C’est relativement “open” mais il y a des restrictions, donc pas open source.
- Pas plus de 700 M d’utilisateurs par mois.
- Pas le droit d’utiliser Llama pour améliorer des autres modèles autres que des dérivés de Llama.
- Et c’est le modèle final qui est ouvert, pas la sauce pour le construire, donc pas de maven build ni le “source code” pour y arriver “from scratch”.
- Attention au risque de sacrifier l’open source pour avoir l’IA plus vite, plus facile.
HashiCorp passe tous ses projets open source en BSL, comme Confluent, Mongo, Redis, Elastic… https://thenewstack.io/hashicorp-abandons-open-source-for-business-source-license/
- Couverture par InfoQ https://www.infoq.com/news/2023/08/hashicorp-adopts-bsl/.
- Fork de Terraform : OpenTF, avec pour objectif de rejoindre la CNCF https://opentf.org/announcement.
Stack overflow annonce Overflow AI https://www.infoq.com/news/2023/09/stackoverflow-overflowai/
- L’intégration de l’IA générative dans leur plateforme publique, Stack Overflow for Teams, ainsi que de nouveaux domaines de produits.
- IA/ML aident à générer des balises initiales et à suggérer des paires question-réponse, permettant aux développeurs de se concentrer sur l’amélioration et la précision.
- Amélioration des capacités de recherche.
- Les forums de questions-réponses basés sur la communauté sont le cœur battant de Stack Overflow. Selon Prashanth Chandrasekar, PDG de Stack Overflow, l’objectif d’OverflowAI est d’améliorer la communauté de diverses manières plutôt que de la remplacer complètement.
Vous avez entendu parler du projet de loi SREN ? http://share.mozilla.org/817319645t
- Le gouvernement français prépare une loi qui pourrait menacer la liberté sur Internet. Le projet de loi visant à sécuriser et réguler l’espace numérique (SREN) obligerait les navigateurs web, comme Mozilla Firefox, à bloquer des sites web directement au niveau du navigateur.
- Mozilla lance une pétition pour retirer cette énième solution stupide pour censurer Internet.
Conférences
La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :
- 8 septembre 2023 : JUG Summer Camp - La Rochelle (France)
- 14 septembre 2023 : Cloud Sud - Toulouse (France) & Online
- 18 septembre 2023 : Agile Tour Montpellier - Montpellier (France)
- 19 septembre 2023 : Salon de la Data Nantes - Nantes (France) & Online
- 19-20 septembre 2023 : Agile en Seine - Paris (France)
- 21-22 septembre 2023 : API Platform Conference - Lille (France) & Online
- 22 septembre 2023 : Agile Tour Sophia Antipolis - Valbonne (France)
- 25-26 septembre 2023 : BIG DATA & AI PARIS 2023 - Paris (France)
- 28-30 septembre 2023 : Paris Web - Paris (France)
- 2-6 octobre 2023 : Devoxx Belgium - Antwerp (Belgium)
- 6 octobre 2023 : DevFest Perros-Guirec - Perros-Guirec (France)
- 10 octobre 2023 : ParisTestConf - Paris (France)
- 11-13 octobre 2023 : Devoxx Morocco - Agadir (Morocco)
- 12 octobre 2023 : Cloud Nord - Lille (France)
- 12-13 octobre 2023 : Volcamp 2023 - Clermont-Ferrand (France)
- 12-13 octobre 2023 : Forum PHP 2023 - Marne-la-Vallée (France)
- 13-14 octobre 2023 : SecSea 2K23 - La Ciotat (France)
- 17-20 octobre 2023 : DrupalCon Lille - Lille (France)
- 19-20 octobre 2023 : DevFest Nantes - Nantes (France)
- 19-20 octobre 2023 : Agile Tour Rennes - Rennes (France)
- 26 octobre 2023 : Codeurs en Seine - Rouen (France)
- 30 septembre 2023 : ScalaIO - Paris (France)
- 26-27 octobre 2023 : Agile Tour Bordeaux - Bordeaux (France)
- 26-29 octobre 2023 : SoCraTes-FR - Orange (France)
- 10 novembre 2023 : BDX I/O - Bordeaux (France)
- 15 novembre 2023 : DevFest Strasbourg - Strasbourg (France)
- 16 novembre 2023 : DevFest Toulouse - Toulouse (France)
- 18-19 novembre 2023 : Capitole du Libre - Toulouse (France)
- 23 novembre 2023 : DevOps D-Day #8 - Marseille (France)
- 23 novembre 2023 : Agile Grenoble - Grenoble (France)
- 30 novembre 2023 : PrestaShop Developer Conference - Paris (France)
- 30 novembre 2023 : WHO run the Tech - Rennes (France)
- 6-7 décembre 2023 : Open Source Experience - Paris (France)
- 7 décembre 2023 : Agile Tour Aix-Marseille - Gardanne (France)
- 7-8 décembre 2023 : TechRocks Summit - Paris (France)
- 8 décembre 2023 : DevFest Dijon - Dijon (France)
- 31 janvier 2024-3 février 2024 : SnowCamp - Grenoble (France)
- 6-7 mars 2024 : FlowCon 2024 - Paris (France)
- 19-22 mars 2024 : KubeCon + CloudNativeCon Europe 2024 - Paris (France)
- 28-29 mars 2024 : SymfonyLive Paris 2024 - Paris (France)
- 17-19 avril 2024 : Devoxx France - Paris (France)
- 25-26 avril 2024 : MiXiT - Lyon (France)
- 25-26 avril 2024 : Android Makers - Paris (France)
- 6-7 juin 2024 : DevFest Lille - Lille (France)
Nous contacter
Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs
Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/
LCC 298 - De l'IA à toutes les sauces
Posté le 24/07/2023Dans cet épisode estival Guillaume, Emmanuel et Arnaud parcourent les nouvelles du début d’été. Du Java, du Rust, du Go du côté des langages, du Micronaut, du Quarkus pour les frameworks, mais aussi du WebGPU, de l’agilité, du DDD, des sondages, de nombreux outils et surtout de l’intelligence artificielle à toutes les sauces (dans les bases de données, dans les voitures…).
Enregistré le 21 juillet 2023
Téléchargement de l’épisode LesCastCodeurs-Episode-298.mp3
News
Langages
La release candidate de Go 1.21 supporte WASM et WASI nativement https://go.dev/blog/go1.21rc
StringBuilder
ou concatenation de String
https://reneschwietzke.de/java/the-stringbuilder-advise-is-dead-or-isnt-it.html
StringBuilder
était la recommendation car ça créait moins d’objets notamment.- Mais la JVM a évolué et le compilateur ou JIT remplace cela par du code efficace.
- Quelques petites exceptions.
- Le code froid (c.-à-d. startup time) qui est encore interprété peut bénéficier de
StringBuilder
. - Autre cas, la concatenation dans des boucles où le JIT ne pourrait peut-être pas optimiser.
- Le
StringBuilder
“fluid” est plus efficace (inliné ?). - Ces règles ne changent pas si des objets sont stringifié pour être concaténés.
GPT-4 n’est pas une révolution https://thealgorithmicbridge.substack.com/p/gpt-4s-secret-has-been-revealed
- Rumeurs, car beaucoup de secrets autour de GPT-4
- Pas un modèle à 1 trillion de paramètres, mais 8 à 220 milliards combinés intelligemment.
- Les chercheurs attendaient un breakthrough mais c’est une évolution et pas particulièrement nouveau.
- Méthode déjà implémentée par des chercheurs chez Google (maintenant chez OpenAI).
- Ils ont retardé la compétition avec ces rumeurs de breakthrough, mais 8 LLaMA peuvent peut-être rivaliser avec GPT-4.
Le blog Open Source de Google propose un article sur 5 mythes ou non sur l’apprentissage et l’utilisation de Rust https://opensource.googleblog.com/2023/06/rust-fact-vs-fiction-5-insights-from-googles-rust-journey-2022.html
- Il faut plus de 6 mois pour apprendre Rust : plutôt faux ; quelques semaines à 3-4 mois max.
- Le compilateur Rust n’est pas aussi rapide qu’on le souhaiterait — vrai !
- Le code unsafe et l’interop sont les plus gros challenges — faux, ce sont plutôt les macros, l’ownership/borrowing et la programmation asynchrone.
- Rust fournit des messages d’erreur de compilation géniaux — vrai.
- Le code Rust est de haute qualité — vrai.
InfoQ sort un nouveau guide sur le Pattern Matching pour le switch de Java https://www.infoq.com/articles/pattern-matching-for-switch/
- Le pattern matching supporte tous les types de référence.
- L’article parle du cas de la valeur
null
. - L’utilisation des patterns “guarded” avec le mot clé
when
. - L’importance de l’ordre des
case
s. - Le pattern matching peut être utilisé aussi avec le
default
desswitch
s - Le scope des variables du pattern.
- Un seul pattern par case label.
- Un seul case match-all dans un bloc
switch
. - L’exhaustivité de la couverture des types.
- L’utilisation des generics.
- La gestion d’erreur avec
MatchException
.
Librairies
Sortie de Micronaut 4 https://micronaut.io/2023/07/14/micronaut-framework-4-0-0-released/
- Langage minimal : Java 17, Groovy 4 et Kotlin 1.8.
- Support de la dernière version de GraalVM.
- Utilisation des GraalVM Reachability Metadata Repository pour faciliter l’utilisation de Native Image.
- Gradle 8.
- Nouvel Expression Language, à la compilation, pas possible au runtime (pour des raisons de sécurité et de support de pré-compilation).
- Support des Virtual Threads.
- Nouvelle couche HTTP, éliminant les stack frames réactives quand on n’utilise pas le mode réactif.
- Support expérimental de IO Uring et HTTP/3.
- Des filtres basés sur les annotations.
- Le HTTP Client utilise maintenant le Java HTTP Client.
- Génération de client et de serveur en Micronaut à partir de fichier OpenAPI.
- L’utilisation YAML n’utilise plus la dépendance SnakeYAML (qui avait des problèmes de sécurité).
- Transition vers Jakarta terminé
- Et plein d’autres mises à jour de modules
- Couverture par InfoQ https://www.infoq.com/news/2023/07/micronaut-brings-virtual-thread/
Quarkus 3.2 et LTS
- https://quarkus.io/blog/quarkus-3-2-0-final-released/
- https://quarkus.io/blog/quarkus-3-1-0-final-released/
- https://quarkus.io/blog/lts-releases/
Infrastructure
Red Hat partage les sources de sa distribution au travers de son Customer Portal, et impacte la communauté qui se base dessus https://almalinux.org/blog/impact-of-rhel-changes/
- RedHat a annoncé un autre changement massif qui affecte tous les rebuilds et forks de Red Hat Enterprise Linux.
- À l’avenir, Red Hat publiera uniquement le code source pour les RHEL RPMs derrière leur portail client.
- Comme tous les clones de RHEL dépendent des sources publiées, cela perturbe encore une fois l’ensemble de l’écosystème Red Hat.
Une analyse du choix de Red Hat sur la distribution du code source de RHEL https://dissociatedpress.net/2023/06/24/red-hat-and-the-clone-wars/
Une réponse de Red Hat aux feux démarrés par l’annonce de la non-distribution des sources de RHEL en public https://www.redhat.com/en/blog/red-hats-commitment-open-source-response-gitcentosorg-changes
Et un lien vers un de ces feux d’une personne proéminente dans la communauté Ansible https://www.jeffgeerling.com/blog/2023/im-done-red-hat-enterprise-linux
Oracle demande à garder un Linux ouvert et gratuit https://www.oracle.com/news/announcement/blog/keep-linux-open-and-free-2023-07-10/
- Suite à l’annonce d’IBM/RedHat, Oracle demande à garder Linux ouvert et gratuit.
- IBM ne veut pas publier le code de RHEL car elle doit payer ses ingénieurs.
- Alors que RedHat a pu maintenir son modèle économique durant des années.
- L’article revient sur CentOS qu’IBM “a tué” en 2020.
- Oracle continu ses efforts de rendre Linux ouvert et libre.
- Oracle Linux continuera à être compatible avec RHEL jusqu’à la version 9.2. Après, ça sera compliqué de maintenir une compatibilité.
- Oracle embauche des devs Linux.
- Oracle demande à IBM de récupérer le downstream d’Oracle et de le distribuer.
SUSE forke RHEL https://www.suse.com/news/SUSE-Preserves-Choice-in-Enterprise-Linux/
- SUSE est la société derrière Rancher, NeuVector, et SUSE Linux Enterprise (SLE).
- Annonce un fork de RHEL.
- $10M d’investissement dans le projet sur les prochaines années.
- Compatibilité assurée de RHEL et CentOS.
Web
Google revend son service de nom de domaine à Squarespace https://www.reddit.com/r/webdev/comments/14agag3/squarespace_acquires_google_domains/
- et ça n’était pas gratuit, donc on n’est pas censé être le produit 😉
- Squarespace est une entreprise américaine spécialisée dans la création de sites internet.
- Squarespace est un revendeur de Google Workspace depuis longtemps.
- La vente devrait se finaliser en Q3 2023.
Petite introduction à WebGPU en français https://blog.octo.com/connaissez-vous-webgpu/
Data
Avec la mode des Large Language Models, on parle de plus en plus de bases de données vectorielles, pour stocker des “embeddings” (des vecteurs de nombre flottant représentant sémantiquement du texte, ou même des images). Un article explique que les Vecteurs sont le nouveau JSON dans les bases relationnelles comme PostgreSQL https://jkatz05.com/post/postgres/vectors-json-postgresql/
- L’article parle en particulier de l’extension pgVector qui est une extension pour PostgreSQL pour rajouter le support des vectors comme type de colonne.
- Google Cloud annonce justement l’intégration de cette extension vectorielle à CloudSQL pour PostgreSQL et à AlloyDB pour PostgreSQL : https://cloud.google.com/blog/products/databases/announcing-vector-support-in-postgresql-services-to-power-ai-enabled-applications.
- Il y a également une vidéo, un notebook Colab, et un article plus détaillé techniquement utilisant LangChain : https://cloud.google.com/blog/products/databases/using-pgvector-llms-and-langchain-with-google-cloud-databases.
- Mais on voit aussi également Elastic améliorer Lucene pour utiliser le support des instructions SIMD pour accélérer les calculs vectoriels (produit scalaire, distance euclidienne, similarité cosinus) : https://www.elastic.co/fr/blog/accelerating-vector-search-simd-instructions.
Outillage
Le sondage de StackOverflow 2023 https://survey.stackoverflow.co/2023/
- L’enquête a été réalisée auprès de 90 000 développeurs dans 185 pays.
- Les développeurs sont plus nombreux (+2%) que l’an dernier à travailler sur site (16% sur site, 41% remote, 42% hybrid).
- Les développeurs sont également de plus en plus nombreux à utiliser des outils d’intelligence artificielle, avec 70 % d’entre eux déclarant les utiliser (44%) ou prévoyant de les utiliser (25) dans leur travail.
- Les langages de programmation les plus populaires sont toujours JavaScript, Python et HTML/CSS.
- Les frameworks web les plus populaires sont Node, React, JQuery.
- Les bases de données les plus populaires sont PostgreSQL, MySQL, et SQLite.
- Les systèmes d’exploitation les plus populaires sont Windows puis macOS et Linux.
- Les IDE les plus populaires sont Visual Studio Code, Visual Studio et IDEA IntelliJ.
Les différents types de déplacement dans Vim https://www.barbarianmeetscoding.com/boost-your-coding-fu-with-vscode-and-vim/moving-blazingly-fast-with-the-core-vim-motions/
JetBrains se met aussi à la mode des assistants IA dans l’IDE https://blog.jetbrains.com/idea/2023/06/ai-assistant-in-jetbrains-ides/
- Une intégration avec OpenAI, mais aussi de plus petits LLMs spécifiques à JetBrains.
- Un chat intégré pour discuter avec l’assistant, puis la possibilité d’intégrer les snippets de code là où se trouve le curseur.
- Possibilité de sélectionner du code et de demander à l’assistant d’expliquer ce que ce bout de code fait, mais aussi de suggérer un refactoring, ou de régler les problèmes potentiels.
- On peut demander à générer la JavaDoc d’une méthode, d’une classe, etc, ou à suggérer un nom de méthode (en fonction de son contenu).
- Génération de message de commit.
- Il faut avoir un compte JetBrains AI pour y avoir accès.
Des commandes macOS plus ou moins connues https://saurabhs.org/advanced-macos-commands
caffeinate
— pour garder le mac éveillé,pbcopy
/pbpaste
— pour interagir avec le clipboard,networkQuality
— pour mesurer la rapidité de l’accès à internet,sips
— pour manipuler / redimensionner des images,textutil
— pour convertir des fichiers Word, texte, HTML,screencapture
— pour faire un screenshot,say
— pour donner une voix à vos commandes.
Le sondage de la communauté ArgoCD https://blog.argoproj.io/cncf-argo-cd-rollouts-2023-user-survey-results-514aa21c21df
Un client d’API open-source et cross platform pour GraphQL, REST, WebSockets, Server-sent events et gRPC https://github.com/Kong/insomnia
Architecture
Moderniser l’architecture avec la découverte via le domain driven discovery https://www.infoq.com/articles/architecture-modernization-domain-driven-discovery/
- Un article très détaillé pour moderniser son architecture en utilisant une approche Domain-Driven Discovery qui se fait en 4 étapes : 1- Encadrer le problème – Clarifier le problème que vous résolvez, les personnes touchées, les résultats souhaités et les contraintes de solution. 2- Analyser l’état actuel – Explorer les processus opérationnels et l’architecture des systèmes existants afin d’établir une base de référence pour l’amélioration. 3- Explorer l’état futur – Concevoir une architecture modernisée fondée sur des contextes délimités, établir des priorités stratégiques, évaluer les options et créer des solutions pour l’état futur. 4- Créer une feuille de route – Créer un plan pour moderniser l’architecture au fil du temps en fonction des flux de travail ou des résultats souhaités.
Récemment, Sfeir a lancé son blog de développement sur https://www.sfeir.dev/
- Plein d’articles techniques sur de nombreux thèmes : front, back, cloud, data, AI/ML, mobile.
- Aussi des tendances, des success stories…
- Par exemple dans les derniers articles : on parle d’Alan Turing, du Local Storage en Javascript, de la préparation de certifications React, l’impact de la cybersécurité sur le cloud.
Demis Hassabis annonce travailler sur une IA nommée Gemini qui dépassera ChatGPT https://www.wired.com/story/google-deepmind-demis-hassabis-chatgpt/
- Demis Hassabis CEO de Google DeepMind créateur de AlphaGO et AlphaFold.
- Travaille sur une IA nommée Gemini qui dépasserait ChatGPT de OpenAI.
- Similaire à GPT-4, mais avec des techniques issues de AlphaGO.
- Encore en développement, va prendre encore plusieurs mois.
- Un remplaçant à Bard ?
Méthodologies
Approcher l’agilité par les traumatismes (de développement) passés des individus https://www.infoq.com/articles/trauma-informed-agile/?utm_campaign=infoq_content&utm_source=twitter&utm_medium=feed&utm_term=culture-methods
- Nous subissons tous un traumatisme du développement qui rend difficile la collaboration avec d’autres - une partie cruciale du travail dans le développement de logiciels agiles.
- Diriger d’une manière tenant compte des traumatismes, ça n’est pas pratiquer la psychothérapie non sollicitée, et ça ne justifie pas les comportements destructeurs sans les aborder.
- Être plus sensible aux traumatismes dans votre leadership peut aider tout le monde à agir de façon plus mature et plus disponible sur le plan cognitif, surtout dans des situations émotionnellement difficiles.
- Dans les milieux de travail tenant compte des traumatismes, les gens accordent plus d’attention à leur état physique et émotionnel.
- Ils s’appuient aussi davantage sur le pouvoir de l’intention, fixent des objectifs d’une manière moins manipulatrice et sont capables d’être empathiques sans s’approprier les problèmes des autres.
Loi, société et organisation
Mercedes va rajouter de l’intelligence artificielle dans ses voitures https://azure.microsoft.com/en-us/blog/mercedes-benz-enhances-drivers-experience-with-azure-openai-service/
- Programme beta-test de 3 mois pour le moment.
- Assistance vocale “Hey Mercedes”.
- Permet de discuter avec la voiture pour trouver son chemin, concocter une recette, ou avoir tout simplement des discussions.
- Ils travaillent sur des plugins pour réserver un resto, acheter des tickets de cinéma.
Free software vs Open Source dans le contexte de l’intelligence artificielle par Sacha Labourey https://medium.com/@sachalabourey/ai-free-software-is-essential-to-save-humanity-86b08c3d4777
- On parle beaucoup d’IA et d’open source.
- Mais il manque la dimension de contrôle des utilisateurs finaux.
- Stallman a créé la FSF par peur de la notion d’humain augmenté par des logiciels qui sont contrôlés par d’autres (implants dans le cerveau etc).
- D’où la GPL et sa viralité qui propage la capacité à voir et modifier le code que l’on fait tourner.
- Dans le débat IA, ce n’est pas seulement Open Source (casser l’oligopolie) mais aussi le Free Software qui est en jeu.
La folie du Cyber Resilience Act (CRA) européen https://news.apache.org/foundation/entry/save-open-source-the-impending-tragedy-of-the-cyber-resilience-act
- Au sein de l’UE, la loi sur la cyber-résilience (CRA) fait maintenant son chemin à travers les processus législatifs (et doit faire l’objet d’un vote clé le 19 juillet 2023). Cette loi s’appliquera à un large éventail de logiciels (et de matériel avec logiciel intégré) dans l’UE. L’intention de ce règlement est bonne (et sans doute attendue depuis longtemps) : rendre le logiciel beaucoup plus sûr.
- Le CRA a une approche binaire : oui/non et considère tout le monde de la même manière.
- Le CRA réglementerait les projets à source ouverte à moins qu’ils n’aient « un modèle de développement entièrement décentralisé ». Mais les modèles OSS sont de complexes mélanges de pur OSS et éditeurs de logiciels.
- les entreprises commerciales et les projets open source devront être beaucoup plus prudents quant à ce que les participants peuvent travailler sur le code, quel financement ils prennent, et quels correctifs ils peuvent accepter.
- Certaines des obligations sont pratiquement impossibles à respecter, par exemple l’obligation de « livrer un produit sans vulnérabilités exploitables connues ».
- Le CRA exige la divulgation de vulnérabilités graves non corrigées et exploitées à l’ENISA (une institution de l’UE) dans un délai mesuré en heures, avant qu’elles ne soient corrigées (complètement opposé aux bonnes pratiques de sécu).
- Une fois de plus une bonne idée à l’origine, mais très mal implémentée qui risque de faire beaucoup de dommages.
Octave Klaba, avec Miro, son frère, et la Caisse des Dépôts, finalisent la création de Synfonium qui va maintenant racheter 100% de Qwant et 100% de Shadow. Synfonium est détenue à 75% par Jezby Venture et Deep Code et à 25% par la CDC. https://twitter.com/i/web/status/1673555414938427392
- L’un des rôles de Synfonium est de créer la masse critique des utilisateurs et des clients B2C et B2B qui vont pouvoir utiliser tous ces services gratuits et payants.
- Vous y retrouverez le moteur de recherche, les services gratuits, la suite collaborative, le social login, mais aussi les services de nos partenaires tech.
- Le but est de créer une plateforme dans le Cloud SaaS EU qui respecte nos valeurs et nos lois européennes.
Yann LeCun : « L’intelligence artificielle va amplifier l’intelligence humaine » https://www.europe1.fr/emissions/linterview-politique-dimitri-pavlenko/yann-lecun-lintelligence-artificielle-va-amplifier-lintelligence-humaine-4189120
Conférences
La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :
- 2-3 septembre 2023 : SRE France SummerCamp - Chambéry (France)
- 6 septembre 2023 : Cloud Alpes - Lyon (France)
- 8 septembre 2023 : JUG Summer Camp - La Rochelle (France)
- 14 septembre 2023 : Cloud Sud - Remote / Toulouse (France)
- 18 septembre 2023 : Agile Tour Montpellier - Montpellier (France)
- 19-20 septembre 2023 : Agile en Seine - Paris (France)
- 19 septembre 2023 : Salon de la Data Nantes - Nantes (France) & Online
- 21-22 septembre 2023 : API Platform Conference - Lille (France) & Online
- 22 septembre 2023 : Agile Tour Sophia Antipolis - Valbonne (France)
- 25-26 septembre 2023 : BIG DATA & AI PARIS 2023 - Paris (France)
- 28-30 septembre 2023 : Paris Web - Paris (France)
- 2-6 octobre 2023 : Devoxx Belgium - Antwerp (Belgium)
- 6 octobre 2023 : DevFest Perros-Guirec - Perros-Guirec (France)
- 10 octobre 2023 : ParisTestConf - Paris (France)
- 11-13 octobre 2023 : Devoxx Morocco - Agadir (Morocco)
- 12 octobre 2023 : Cloud Nord - Lille (France)
- 12-13 octobre 2023 : Volcamp 2023 - Clermont-Ferrand (France)
- 12-13 octobre 2023 : Forum PHP 2023 - Marne-la-Vallée (France)
- 19-20 octobre 2023 : DevFest Nantes - Nantes (France)
- 19-20 octobre 2023 : Agile Tour Rennes - Rennes (France)
- 26 octobre 2023 : Codeurs en Seine - Rouen (France)
- 25-27 octobre 2023 : ScalaIO - Paris (France)
- 26-27 octobre 2023 : Agile Tour Bordeaux - Bordeaux (France)
- 26-29 octobre 2023 : SoCraTes-FR - Orange (France)
- 10 novembre 2023 : BDX I/O - Bordeaux (France)
- 15 novembre 2023 : DevFest Strasbourg - Strasbourg (France)
- 16 novembre 2023 : DevFest Toulouse - Toulouse (France)
- 23 novembre 2023 : DevOps D-Day #8 - Marseille (France)
- 30 novembre 2023 : PrestaShop Developer Conference - Paris (France)
- 30 novembre 2023 : WHO run the Tech - Rennes (France)
- 6-7 décembre 2023 : Open Source Experience - Paris (France)
- 7 décembre 2023 : Agile Tour Aix-Marseille - Gardanne (France)
- 8 décembre 2023 : DevFest Dijon - Dijon (France)
- 7-8 décembre 2023 : TechRocks Summit - Paris (France)
Nous contacter
Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs
Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/
LCC 297 - Lockless design
Posté le 12/06/2023Guillaume, Arnaud et Emmanuel discutent des nouvelles de mai et juin. La communauté Rust, WebAssembly. Guava, Debezium, Kafka, de flame graph, d’open source et bien sûr les large language models.
On répond aussi à la question fondamentale : mais pourquoi Maven n’a pas de fichier .lock
?
Enregistré le 9 juin 2023
Téléchargement de l’épisode LesCastCodeurs-Episode-297.mp3
News
Langages
Lors de Microsoft BUILD 2023, un des fondateurs de OpenAI a fait une excellente présentation de Large Language Models, des GPT https://build.microsoft.com/en-US/sessions/db3f4859-cd30-4445-a0cd-553c3304f8e2
- Il parle du fonctionnement des LLM, comment/pourquoi ils arrivent à générer ce qu’ils génèrent.
- Le fine-tuning, l’apprentissage renforcé avec feedback humain, l’art du prompting.
- Des patterns comme Chain of Thought (CoT) ou ReAct (Reflect then Act).
Leaning Technologies annonce l’arrivée prochaine de CheerpJ 3 : le retour de Java dans le navigateur, grâce à WebAssembly https://leaningtech.com/announcing-cheerpj-3-0-a-jvm-replacement-in-html5-and-webassembly-to-run-java-applications-and-applets-on-modern-browsers/
- Avant la version 3.0, CheerpJ utilisait une approche AOT (Ahead Of Time compilation) qui nécessitait aussi une étape d’intégration continue pour transformer aussi toutes les dépendances JAR associées à un projet.
- Avec la version 3.0, qui devrait sortir cet été, CheerpJ adopte une approche JIT (Just-In-Time compilation) qui ressemble plus à l’approche de Java lui-même.
- Plus besoin non plus de version custom d’OpenJDK.
- Les Applets vous avaient manqué ? Elles sont de retour avec WebAssembly 😀.
Communauté RUST : Il y a de l’eau dans le gaz https://www.jntrnr.com/why-i-left-rust/
- Plus d’infos sur https://gist.github.com/fasterthanlime/42da9378768aebef662dd26dddf04849.
- Lié au backchannel et un petit groupe qui essaie de faire les choses bien, mais qui dérape de l’extérieur.
- En gros, ils ont un process interne pour prendre des décisions.
- Avec ce process, ils ont invité une personne pas super pro-Rust à faire la keynote à RustConf.
- D’autres membres du commité ont vu ça et ont discuté en backchannel pour annuler la décision (sans suivre le process).
- Il y a eu une semaine de pause avant action, mais pas d’annonce.
- Le speaker a été dékeynoté et a donc refusé de venir à la conférence.
- Et paf ! Ça énerve des gens décisionnaire et ils démissionnent.
- Bref des gens qui veulent faire bien, mais en cercle un peu trop fermé.
Les gens de Wasmer étendent WASI avec WASIX, en rajoutant le support POSIX, les threads… permettant de compiler vers WASM plein de projet C/C++ ou Rust, comme cURL https://wasmer.io/posts/announcing-wasix
- Ça frotte un peu entre innovation et standardisation dans la communauté WASM.
- WASMER sont un peu les cowboys startuper.
- Par exemple, ils ont essayé de déposer la marque WebAssembly au nez et à la barbe de la communauté.
- Donc la reaction du cœur de la communauté face à cette annonce est plutôt calme.
- WASI c’est standard, mais ça prend du temps à maturer.
- WASIX c’est cool et disponible maintenant, mais c’est un produit d’une société spécifique, donc pas de portabilité.
Librairies
Guava 32 est sorti et beaucoup de choses annotées en @Beta
ne le sont plus
https://www.reddit.com/r/java/comments/13w2l8w/guava_320_released_today_and_the_beta_annotation/
- Ils ont eu des API en
@Beta
pendant longtemps pour protéger des risques de changements. - En pratique quasi personne ne se limitait au non-beta, et ces API n’ont pas ou peu bougé.
- Ils ont donc enlevé
@Beta
de la plupart des API. - Beaucoup de parties de Guava sont dans le JDK, le cache est dans Caffeine.
- De bons échanges dans les commentaires entre les utilisateurs et Kevin, un des mainteneurs chez Google
Comment démarrer avec l’API PaLM de Google, mais en Java ! https://glaforge.dev/posts/2023/05/30/getting-started-with-the-palm-api-in-the-java-ecosystem/
- Guillaume a écrit une petite application qui génère des histoires pour enfants avec un Large Language Model (l’API PaLM) : https://bed-time-stories.web.app/.
- Le code est disponible sur Github : https://github.com/glaforge/bedtimestories.
- Il explique également le processus incrémental des prompts qui aident à générer aussi le contenu de l’application : https://glaforge.dev/posts/2023/06/08/creating-kids-stories-with-generative-ai/.
Infrastructure
Debezium 2.2 https://debezium.io/blog/2023/04/20/debezium-2-2-final-released/
- Experimental opt-in Parallel Snapshots,
- Incremental snapshots with surrogate keys,
- Quarkus 3 support,
- Ingestion of Oracle changes from logical standby instances,
- Google Spanner improvements,
- New Debezium Server sinks for Infinispan, RabbitMQ, and RocketMQ,
- New Storage APIs for Amazon S3 and RocketMQ,
- Many MongoDB improvements,
- Cassandra connector for Cassandra Enterprise.
Un article sur l’utilisation de Kafka par CloudFlare https://www.infoq.com/articles/kafka-clusters-cloudflare/
- C’est du “classique”, mais bon de se le faire rappeler.
- Beaucoup d’évènements CloudFlare ne passent pas Kafka pour processing.
- Kafka en tant que bus générique.
- Ils ont imposé un message unique par topic via Protobuf.
- Ils ont une Application Service team (internal developer platform) depuis peu de temps.
- GitOps pour création de topic…
- Ils ont développé un connector framework déclaratif pour étendre le panel de patrons d’architecture disponibles.
- Ils ont développé des SDKs d’accès à Kafka avec monitoring (Prometheus).
- Sympa à lire.
Post mortem du problème chez Datadog https://www.datadoghq.com/blog/2023-03-08-multiregion-infrastructure-connectivity-issue/
- Datadog a perdu tous ses services dans la plupart de ses regions pendant 3 heures avant la première récupération et 10 heures au total pour la récupération totale.
- Équipe : 10 senior engineering leaders, about 70 local incident commanders and a pool of 450 to 750 incident responders active throughout the incident, which required four shifts to bring the incident to full resolution.
- Cause : une mise à jour de systemd appliquée sur la plupart de leurs VM en quasi parallèle qui a effacé les routes des conteneurs et ne les a pas remis ; c’est un cas qui n’arrive pas au reboot d’un nœud (init sequence).
- Des dizaines de milliers de nœuds ont été impactés.
- En général, ils font du rollout par région en enlevant les nœuds etc, mais le base OS avait un legacy update channel activé (vs géré par les équipes de Datadog manuellement).
- Les nœuds de controllers qui sont censés recycler les nœuds n’ont pu le faire vu le nombre de nœuds et surtout parce qu’eux-mêmes étaient affectés.
- L’autre article.
Cloud
Le datacenter parisien europe-west9-a
est en panne depuis 3 semaines
https://www.lebigdata.fr/data-center-panne
- Un feu s’est déclenché et a touché une zone.
- Le datacenter reste opérationnel sur les zones non touchées, sauf BigTable qui a besoin de la zone touchée.
- Les autres services fonctionnent, sauf les applis utilisateurs qui ne tournaient que sur la zone affectée.
Outillage
Podman Desktop 1.0 est sorti https://podman-desktop.io/blog/podman-desktop-release-1.0
- Pas grand-chose d’autre à dire que c’est la 1.0.
- “Works on my machine”
Contract testing with Pact https://hollycummins.com/contract-testing-devoxx-greece/
- Conférence.
- Quand on change un microservice l’autre casse.
- Les tests d’integration sont lents, instables et demandent de grosses machines ou des environnements remote de dev.
- Mock / unit tests ne sont pas vraiment le code de l’autre équipe.
- D’où les contract tests qui vivent entre les tests end to end et les tests unitaires.
- Peut partir d’un test mock et remplacer avec pact côté consommateur.
- En faisant tourner un pact listener qui enregistre la déclaration et les retours attendus / générés par l’appel du test.
- Copier ce fichier vers le producteur.
- Copier à la main, dans le repo, via un broker.
- Ajoute un test pact côté producteur qui va exercer le JSON et vérifier que cela marche.
- Tests de pact sont plus profonds qu’un test OpenAPI.
- Consommateur utilise pact comme mock et vérifie le provider avec le contract du mock.
Pourquoi Maven n’a pas de fichier lock ? https://www.reddit.com/r/Maven/comments/vkcmys/why_maven_doesnt_have_a_lock_file_like/
- Conversation intéressante sur les fichiers
.lock
dans les builds. - Par exemple Ruby a le
Gemfile.lock
, npm pareil, mais pas Java ? - Fondamentalement, c’est dû aux valeurs par défaut initiales et à la culture de la communauté.
- Les versions range sont peu ou pas utilisés en Maven.
- Alors que c’est l’approche par défaut sur d’autres plateformes
- La poule et l’œuf.
Simplifier les flame graph avec JBang https://someth2say.wordpress.com/2023/06/04/jbang-and-flame-graphs/
- Discute des flame graph.
- Pour le temps consommé et pas un call graph.
- En hauteur, c’est la profondeur d’appel.
- Ne regarder que la largeur, pas l’ordre.
- Pas quand et où une action est faite, mais qui l’a faite.
- Le reste discute de la manière d’utiliser JBang pour lancer le programme et le javaagent.
Les modérateurs de Stack Overflow en grève contre le flux de réponses d’intelligence artificielle https://openletter.mousetail.nl/
- Le ban des contenus générés par l’IA a été levé discrètement par Stack Overflow.
- Peur du flux de données massif et des hallucinations difficiles à détecter sans passer du temps.
- Pas de consensus communautaire.
- Stack Overflow est une des sources trustées pour les LLM des intelligences artificielles génératives (serpent qui se mord la queue).
- Les modérateurs font tourner l’anti-spam, gèrent les flags levés, ferment ou effacent les entrées, genre les bots qui détectent le plagiat…
- 414 votants dès les premières heures.
Just, un petit outil en ligne de commande avec une syntaxe inspirée de make, pour exécuter des commandes fréquentes dans nos projets https://glaforge.dev/posts/2023/06/07/just-a-handy-command-line-tool/
- Syntaxe proche de celle de make.
- Possibilité de définir des dépendances entre tâches.
- Support de paramètres.
- Peut charger des fichier
.env
. - S’installe sur tous les systèmes d’exploitation qu’on aime bien (et qu’on n’aime pas aussi).
Méthodologies
AWS retire ses documentations en Open Source https://www.infoq.com/news/2023/06/aws-documentation-github/
- Ils ont open-sourcé en espérant des contributions il y a deux ans, mais sans changer les approches en interne.
- Résultat : copie de repos de l’intérieur vers l’extérieur.
- Tracker de travail interne != externe.
- C’était plus compliqué.
- Leçon, embrasser entièrement sinon les frictions sont compliquées.
Un guide pour communiquer avec l’IA https://learnprompting.org/
- Gratuit et open source.
- Prompt Engineering ou comment rédiger vos prompts.
- Plusieurs niveaux (Basic, Intermédiaire, Avancé..).
- Défini plein de concepts: Prompt, Few Shot Prompt, LLMs…
Loi, société et organisation
Migration de Twitter vers Mastodon (ou plutôt “dual run”) https://glaforge.dev/talks/2023/06/09/from-bird-to-elephant-starting-a-new-journey-on-mastodon/
- Présentation de Guillaume à Devoxx France et Grèce
- Avec code sur Github pour un bot Mastodon: https://github.com/glaforge/stootistics
- Et un service en ligne pour voir la popularité de ses derniers posts sur Mastodon https://stootistics.web.app/
Conférences
Aurelie Vache publie son agenda des conferences via le site: https://developers.events/
La liste des conférences provenant de Developers Conferences Agenda/List par Aurélie Vache et contributeurs :
- 14-15 juin 2023 : OW2 openSource Conf - Paris (France)
- 14-17 juin 2023 : VivaTech (Viva Technology) - https://vivatechnology.com/) - Paris (France)
- 15-16 juin 2023 : Le Camping des Speakers - Baden (France)
- 15-17 juin 2023 : Pas Sage En Seine - Choisy-le-Roi (France)
- 20 juin 2023 : Mobilis in Mobile - Nantes (France)
- 20 juin 2023 : Cloud Est - Villeurbanne (France)
- 20-22 juin 2023 : Adeo DevSummit - Lille (France)
- 21-23 juin 2023 : Rencontres R - Avignon (France)
- 23 juin 2023 : Unconf HackYourJob - Région lyonnaise (France)
- 28-30 juin 2023 : Breizh Camp - Rennes (France)
- 29 juin 2023 : Google Cloud Summit France - Paris (France)
- 29-30 juin 2023 : Sunny Tech - Montpellier (France)
- 29-30 juin 2023 : Agi’Lille - Lille (France)
- 7-9 juillet 2023 : Nantes Maker Campus - Nantes (France)
- 2-3 septembre 2023 : SRE France SummerCamp - Chambéry (France)
- 6 septembre 2023 : Cloud Alpes - Lyon (France)
- 8 septembre 2023 : JUG Summer Camp - La Rochelle (France)
- 14 septembre 2023 : Cloud Sud - Remote / Toulouse (France)
- 18 septembre 2023 : Agile Tour Montpellier - Montpellier (France)
- 19-20 septembre 2023 : Agile en Seine - Paris (France)
- 19 septembre 2023 : Salon de la Data Nantes - Nantes (France) & Online
- 21-22 septembre 2023 : API Platform Conference - Lille (France) & Online
- 25-26 septembre 2023 : BIG DATA & AI PARIS 2023 - Paris (France)
- 28-30 septembre 2023 : Paris Web - Paris (France)
- 2-6 octobre 2023 : Devoxx Belgium - Antwerp (Belgium)
- 6 octobre 2023 : DevFest Perros-Guirec - Perros-Guirec (France)
- 10 octobre 2023 : ParisTestConf - Paris (France)
- 11-13 octobre 2023 : Devoxx Morocco - Agadir (Morocco)
- 12 octobre 2023 : Cloud Nord - Lille (France)
- 12-13 octobre 2023 : Volcamp 2023 - Clermont-Ferrand (France)
- 12-13 octobre 2023 : Forum PHP 2023 - Marne-la-Vallée (France)
- 19-20 octobre 2023 : DevFest Nantes - Nantes (France)
- 19-20 octobre 2023 : Agile Tour Rennes - Rennes (France)
- 26 octobre 2023 : Codeurs en Seine - Rouen (France)
- 25-27 octobre 2023 : ScalaIO - Paris (France)
- 26-27 octobre 2023 : Agile Tour Bordeaux - Bordeaux (France)
- 10 novembre 2023 : BDX I/O - Bordeaux (France)
- 15 novembre 2023 : DevFest Strasbourg - Strasbourg (France)
- 16 novembre 2023 : DevFest Toulouse - Toulouse (France)
- 6-7 décembre 2023 : Open Source Experience - Paris (France)
- 7-8 décembre 2023 : TechRocks Summit - Paris (France)
- 31 janvier 2024-3 février 2024 : SnowCamp - Grenoble (France)
- 19-22 mars 2024 : KubeCon + CloudNativeCon Europe 2024 - Paris (France)
- 28-29 mars 2024 : SymfonyLive Paris 2024 - Paris (France)
- 17-19 avril 2024 : Devoxx France - Paris (France)
- 25-26 avril 2024 : MiXiT - Lyon (France)
- 25-26 avril 2024 : Android Makers - Paris (France)
Nous contacter
Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs
Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/
LCC 296 - Interview Google IA IA I/O 2023
Posté le 25/05/2023Dans cet épisode, Antonio, Emmanuel et Guillaume reviennent sur les nouveautés et annonces faites à Google I/O 2023 : de nouveaux téléphones Pixel qui se plient ou pas, et surtout de l’intelligence artificielle du sol au plafond ! Que ce soit dans Android, dans Google Workspace, dans Google Cloud, une tonne de produits passe en mode survitaminé à l’IA. Guillaume, Antonio et Emmanuel discutent aussi de l’impact qu’ils voient sur l’AI, et de comment les Large Language Models sont raffinés et pourquoi on les fait halluciner, de subtilités du langage des signes.
Enregistré le 23 mai 2023
Téléchargement de l’épisode LesCastCodeurs-Episode-296.mp3
Google I/O 2023
Site web : https://io.google/2023/
Keynote principale : https://io.google/2023/program/396cd2d5-9fe1-4725-a3dc-c01bb2e2f38a/
Keynote développeur : https://io.google/2023/program/9fe491dd-cadc-4e03-b084-f75e695993ea/
Vidéo résumée en 10 minutes de toutes les annonces : https://www.youtube.com/watch?v=QpBTM0GO6xI&list=TLGGCy91ScdjTPYxNjA1MjAyMw
Vidéo de toutes les sessions techniques : https://io.google/2023/program/?q=technical-session
Google I/O s’est tenu il y a 10 jours en Californie, dans l’amphithéâtre de Shoreline, près du campus de Google.
Seulement 2000 personnes sur place, un chat et un jeu en ligne pour assister à distance.
Jeu en ligne I/O Flip créé avec Flutter, Dart, Firebase, et Cloud Run, et tous les assets graphiques générés par Generative AI https://blog.google/technology/ai/google-card-game-io-flip-ai/
Des Pixels plein les yeux !
Des détails sur le design des nouveaux appareils : https://blog.google/products/pixel/google-pixel-fold-tablet-7a-design/
Pixel Fold
Article : https://blog.google/products/pixel/google-pixel-fold/
- Premier téléphone foldable de Google (après Samsung et Oppo)
- Un écran sur le dessus, et un grand écran pliable à l’intérieur
- Pratique pour la traduction où peut voir une discussion traduire en deux langues d’un côté sur un écran et dans l’autre langue sur l’autre
- Utilisation créative de la pliure : mode “laptop”, pour les selfies, pour poser l’appareil pour des photos de nuit
- Par contre… pas disponible en France, et tout de même presque 1900€ !
Pixel Tablet
Article : https://blog.google/products/pixel/google-pixel-tablet/
- Une belle tablette de 11 pouces, avec un dock de recharge avec enceinte intégrée
- Processeur Tensor G2, Chromecast intégré
- C’est un peu comme le Google Nest Hub Max, mais avec un écran détachable
- Une coque pratique avec un trépied intégré et qui n’empêche pas de recharger la tablette sur le dock
- En mode dock, c’est comme l’écran du Google Home App, et dès qu’on la décroche, on est en mode multi-utilisateur, chacun avec son profil
Pixel 7a
Article : https://blog.google/products/pixel/pixel-7a-io-2023/
- Écran de 6 pouces
- Triple appareil photo (grand angle, principal, et photo avant pour les selfies)
- 509 euros
- Magic Eraser pour effacer les trucs qu’on ne veut pas dans la photo, Magic Unblur pour rendre une photo floue plus nette, Real Tone pour rendre les peaux foncées plus naturelles
Android
Article quoi de neuf dans Android : https://blog.google/products/android/android-updates-io-2023/
- Dans Messages, Magic Compose dans les conversations, l’IA nous aide à concevoir nos messages, dans différents styles (plus pro, plus fun, dans le style de Shakespeare)
- Android 14 devrait arriver un peu plus tard dans l’année, avec plus de possibilités de customisation (fond d’écran généré par Gen AI, fond d’écran Emojis, couleurs associées, fond d’écran 3D issus de ses photos) https://blog.google/products/android/new-android-features-generative-ai/
- StudioBot : un chatbot intégré à Android Studio pour aider au développement d’applis Android https://io.google/2023/program/d94e89c5-1efa-4ab2-a13a-d61c5eb4e49c/
- 800 millions d’utilisateurs sont passés à RCS pour le messaging
- Adaptation de 50 applications Android pour s’adapter aux foldables https://blog.google/products/android/android-app-redesign-tablet-foldable/
- Wear OS 4 va rajouter le backup restore quand on change de montre et autres nouveautés https://blog.google/products/wear-os/wear-os-update-google-io-2023/
- 800 chaînes TV gratuites dans Google TV sur Android et dans la voiture
- Android Auto va être disponible de 200 millions de voitures
https://blog.google/products/android/android-auto-new-features-google-io-2023/ - Waze disponible globalement sur le playstore dans toutes les voitures avec Android Auto
Google Maps
Article : https://blog.google/products/maps/google-maps-updates-io-2023/
- Maps propose 20 milliards de km de direction tous les jours
- Immersive View for Routes
- 15 villes : Amsterdam, Berlin, Dublin, Florence, Las Vegas, London, Los Angeles, Miami, New York, Paris, San Francisco, San Jose, Seattle, Tokyo et Venice
- Possibilité pour les développeurs de s’intégrer et rajouter des augmentations 3D, des marqueurs
Google Photos
Article Magic Editor : https://blog.google/products/photos/google-photos-magic-editor-pixel-io-2023/
- Magic Editor survitaminé à l’IA pour améliorer les photos, en déplaçant des gens, en rajoutant des parties coupées, ou bien rendre le ciel plus beau
- Possible que ce soit limité aux téléphones Pixel au début
Projets expérimentaux
- Project Starline (écran avec caméra 3D qui donne un rendu 3D de son interlocuteur comme s’il était en face de soi) a été amélioré pour prendre moins de place https://blog.google/technology/research/project-starline-prototype/
- Universal Translator : une nouvelle expérimentation pour faire du doublage et traduction automatique avec synchronisation des mouvements des lèvres
- Project Tailwind, une sorte de notebook dans lequel on peut rajouter tous ses documents à partir de drive, et poser des questions sur leur contenu, proposer des résumés, de faire du brainstorming sur ces thèmes https://thoughtful.sandbox.google.com/about
- MusicLM : un large language model pour générer de la musique à partir d’un texte de prompt (liste d’attente pour s’inscrire) https://blog.google/technology/ai/musiclm-google-ai-test-kitchen/
- Project Gameface : utilisation des expressions du visage pour commander une souris et un ordinateur, pour les personnes qui ont perdu leur mobilité https://blog.google/technology/ai/google-project-gameface/
- VisualBlocks : pour expérimenter dans une interface drag’n drop avec le développement de modèles pour Tensorflow lite et js https://visualblocks.withgoogle.com/
- MakerStudio : pour les bidouilleurs et développeurs https://makersuite.google.com/
https://developers.googleblog.com/2023/05/palm-api-and-makersuite-moving-into-public-preview.html
Search Labs
Article : https://blog.google/products/search/generative-ai-search/
- Expérimentations pour rajouter l’IA générative dans Google Search
- Faire des recherches avec des requêtes avec des phrases plus complexes, en intégrant des réponses comme Bard, avec des liens, des suggestions d’autres recherches associées
- Mais aussi proposer des publicités mieux ciblées
- On peut s’inscrire à Search Labs pour tester cette nouvelle expérience, mais au début juste en anglais et juste pour les US
- Des intégrations avec Google Shopping pour proposer et filtrer des produits qui correspondent à la requête
- Recherche à l’aide d’image, avec Google Lens : 12 milliards de recherches visuelles par mois
Palm et Bard
- Annonce du modèle LLM Palm 2 utilisé dans Bard et dans Google Cloud https://blog.google/technology/ai/google-palm-2-ai-large-language-model/
- PaLM 2 est en cours d’intégration dans 25 produits de Google
- Supportera 100 langues différentes (pour l’instant seulement l’anglais, japonais et coréen), avec déjà les 40 langues les plus parlées d’ici à la fin de l’année
- Maintenant disponible dans 180 pays… sauf l’Europe !!!
- Capacité de raisonnement accrue
- Peut coder dans une vingtaine de langages de programmation différents dont Groovy
- Différentes tailles de modèles : Gecko, Otter, Bison et Unicorn, mais le nombre de paramètres n’est pas communiquée, comme pour GPT-4 d’OpenAI
- Utilisable pour des requêtes et pour du chat
- Des modèles dérivées fine-tunés Med-PaLM 2 sur du savoir médical, sur l’analyse visuelle des radios et Sec-PaLM, entrainé sur des cas d’utilisation sur le thème de la cybersécurité, pour aider à déceler des scripts malicieux, des vecteurs d’attaque
- Sundar Pichai a aussi annoncé que Google travaillait déjà sur la prochaine évolution de ses LLM avec un modèle appelé Gemini. Peu de détails à part qu’il sera multimodal (en particulier recherche combinée image et texte par ex.)
- Partenariat et intégration d’Adobe Firefly dans Bard pour générer des images https://blog.adobe.com/en/publish/2023/05/10/adobe-firefly-adobe-express-google-bard
Duet AI pour Google Workspace
Article : https://workspace.google.com/blog/product-announcements/duet-ai
- Dans Gmails et Docs, propose d’aider à la rédaction de vos emails et documents
- une extension de “smart compose” qui va permettre de générer des emails entiers, d’améliorer le style, de corriger la grammaire, éviter les répétitions de texte
- Dans Docs, des nouveaux “smart chips” pour rajouter des variables, des templates
- Dans Slides, rajouter des images générées par IA
- Des prompts dans Sheets pour générer un draft de table
- Dans Google Meet, possibilité de créer une image de fond customisée avec Generative AI
- Ces améliorations font parties de Workspace Labs auquel on peut s’inscrire dans la liste d’attente https://workspace.google.com/labs-sign-up/
Google Cloud
Intégration de Generative AI partout https://cloud.google.com/blog/products/ai-machine-learning/google-cloud-launches-new-ai-models-opens-generative-ai-studio
- Nouvelles VM A3 avec les GPUs H100 de Nvidia, idéal pour l’entrainement de modèles de machine learning, avec 26 exaFlops de performance https://cloud.google.com/blog/products/compute/introducing-a3-supercomputers-with-nvidia-h100-gpus
- Trois nouveaux modèles LLM dans Vertex AI : Imagen (private preview) pour générer des images, Codey pour la génération de code, et Chirp pour la génération de la parole supportant 100 langues différentes avec 2 milliards de paramètres vocaux
- Model Garden : avec les modèles de machine learning y compris externes et open sources
- Ajout des embeddings pour le texte et l’image
- RLHF, Reinforcement Learning from Human Feedback bientôt intégrer pour étendre Vertex AI tuning et prompt design avec une boucle de feedback humaine
- Generative AI Studio pour tester ses prompts zero-shot, one-shot, multi-shots
- Duet AI pour Google Cloud https://cloud.google.com/blog/products/application-modernization/introducing-duet-ai-for-google-cloud
- Assistance de code dans VSCode et bientôt les IDEs JetBrains grâce au plugin Cloud Code, et dans Cloud Workstations.
- Intégration dans les IDEs d’un chat pour comme un compagnon pour discuter d’architecture, trouver les commandes à lancer pour son projet
- Le modèle de code de Codey fonctionne sur une vingtaine de languages de programmation, mais un modèle fine-tuné a été entrainé sur toute la doc de Google Cloud, donc pourra aider en particulier sur l’utilisation des APIs de Google Cloud, ou l’utilisation de la ligne de commande gcloud
- Duet AI est aussi dans App Sheet, la plateforme low/no-code, et permettra de chatter avec un chatbot pour générer une application App Sheet
- Quoi de neuf dans Firebase https://firebase.blog/posts/2023/05/whats-new-at-google-io
Web
Article : https://developers.googleblog.com/2023/05/io23-developer-keynote-recap.html
- Flutter 3 et Dart 3.10 https://io.google/2023/program/7a253260-3941-470b-8a4d-4253af000119/
- WebAssembly
https://io.google/2023/program/1d176349-7cf8-4b51-b816-a90fc9d7d479/ - WebGPU
https://io.google/2023/program/0da196f5-5169-43ff-91db-8762e2c424a2/ - Baseline
https://io.google/2023/program/528a223c-a3d6-46c5-84e4-88af2cf62670/
https://web.dev/baseline/
Nous contacter
Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs
Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/