LCC 296 - Interview Google IA IA I/O 2023

Dans cet épisode, Antonio, Emmanuel et Guillaume reviennent sur les nouveautés et annonces faites à Google I/O 2023 : de nouveaux téléphones Pixel qui se plient ou pas, et surtout de l’intelligence artificielle du sol au plafond ! Que ce soit dans Android, dans Google Workspace, dans Google Cloud, une tonne de produits passe en mode survitaminé à l’IA. Guillaume, Antonio et Emmanuel discutent aussi de l’impact qu’ils voient sur l’AI, et de comment les Large Language Models sont raffinés et pourquoi on les fait halluciner, de subtilités du langage des signes.

Enregistré le 23 mai 2023

Téléchargement de l’épisode LesCastCodeurs-Episode-296.mp3

Google I/O 2023

Site web : https://io.google/2023/

Keynote principale : https://io.google/2023/program/396cd2d5-9fe1-4725-a3dc-c01bb2e2f38a/

Keynote développeur : https://io.google/2023/program/9fe491dd-cadc-4e03-b084-f75e695993ea/

Vidéo résumée en 10 minutes de toutes les annonces : https://www.youtube.com/watch?v=QpBTM0GO6xI&list=TLGGCy91ScdjTPYxNjA1MjAyMw

Vidéo de toutes les sessions techniques : https://io.google/2023/program/?q=technical-session

Google I/O s’est tenu il y a 10 jours en Californie, dans l’amphithéâtre de Shoreline, près du campus de Google.

Seulement 2000 personnes sur place, un chat et un jeu en ligne pour assister à distance.

Jeu en ligne I/O Flip créé avec Flutter, Dart, Firebase, et Cloud Run, et tous les assets graphiques générés par Generative AI https://blog.google/technology/ai/google-card-game-io-flip-ai/

Des Pixels plein les yeux !

Des détails sur le design des nouveaux appareils : https://blog.google/products/pixel/google-pixel-fold-tablet-7a-design/

Pixel Fold

Article : https://blog.google/products/pixel/google-pixel-fold/

Premier téléphone foldable de Google (après Samsung et Oppo)
Un écran sur le dessus, et un grand écran pliable à l’intérieur
- Pratique pour la traduction où peut voir une discussion traduire en deux langues d’un côté sur un écran et dans l’autre langue sur l’autre
Utilisation créative de la pliure : mode “laptop”, pour les selfies, pour poser l’appareil pour des photos de nuit
Par contre… pas disponible en France, et tout de même presque 1900€ !

Pixel Tablet

Article : https://blog.google/products/pixel/google-pixel-tablet/

Une belle tablette de 11 pouces, avec un dock de recharge avec enceinte intégrée
Processeur Tensor G2, Chromecast intégré
C’est un peu comme le Google Nest Hub Max, mais avec un écran détachable
Une coque pratique avec un trépied intégré et qui n’empêche pas de recharger la tablette sur le dock
En mode dock, c’est comme l’écran du Google Home App, et dès qu’on la décroche, on est en mode multi-utilisateur, chacun avec son profil

Pixel 7a

Article : https://blog.google/products/pixel/pixel-7a-io-2023/

Écran de 6 pouces
Triple appareil photo (grand angle, principal, et photo avant pour les selfies)
509 euros
Magic Eraser pour effacer les trucs qu’on ne veut pas dans la photo, Magic Unblur pour rendre une photo floue plus nette, Real Tone pour rendre les peaux foncées plus naturelles

Android

Article quoi de neuf dans Android : https://blog.google/products/android/android-updates-io-2023/

Dans Messages, Magic Compose dans les conversations, l’IA nous aide à concevoir nos messages, dans différents styles (plus pro, plus fun, dans le style de Shakespeare)
Android 14 devrait arriver un peu plus tard dans l’année, avec plus de possibilités de customisation (fond d’écran généré par Gen AI, fond d’écran Emojis, couleurs associées, fond d’écran 3D issus de ses photos) https://blog.google/products/android/new-android-features-generative-ai/
StudioBot : un chatbot intégré à Android Studio pour aider au développement d’applis Android https://io.google/2023/program/d94e89c5-1efa-4ab2-a13a-d61c5eb4e49c/
800 millions d’utilisateurs sont passés à RCS pour le messaging
Adaptation de 50 applications Android pour s’adapter aux foldables https://blog.google/products/android/android-app-redesign-tablet-foldable/
Wear OS 4 va rajouter le backup restore quand on change de montre et autres nouveautés https://blog.google/products/wear-os/wear-os-update-google-io-2023/
800 chaînes TV gratuites dans Google TV sur Android et dans la voiture
Android Auto va être disponible de 200 millions de voitures
https://blog.google/products/android/android-auto-new-features-google-io-2023/
Waze disponible globalement sur le playstore dans toutes les voitures avec Android Auto

Google Maps

Article : https://blog.google/products/maps/google-maps-updates-io-2023/

Maps propose 20 milliards de km de direction tous les jours
Immersive View for Routes
15 villes : Amsterdam, Berlin, Dublin, Florence, Las Vegas, London, Los Angeles, Miami, New York, Paris, San Francisco, San Jose, Seattle, Tokyo et Venice
Possibilité pour les développeurs de s’intégrer et rajouter des augmentations 3D, des marqueurs

Google Photos

Article Magic Editor : https://blog.google/products/photos/google-photos-magic-editor-pixel-io-2023/

Magic Editor survitaminé à l’IA pour améliorer les photos, en déplaçant des gens, en rajoutant des parties coupées, ou bien rendre le ciel plus beau
Possible que ce soit limité aux téléphones Pixel au début

Projets expérimentaux

Project Starline (écran avec caméra 3D qui donne un rendu 3D de son interlocuteur comme s’il était en face de soi) a été amélioré pour prendre moins de place https://blog.google/technology/research/project-starline-prototype/
Universal Translator : une nouvelle expérimentation pour faire du doublage et traduction automatique avec synchronisation des mouvements des lèvres
Project Tailwind, une sorte de notebook dans lequel on peut rajouter tous ses documents à partir de drive, et poser des questions sur leur contenu, proposer des résumés, de faire du brainstorming sur ces thèmes https://thoughtful.sandbox.google.com/about
MusicLM : un large language model pour générer de la musique à partir d’un texte de prompt (liste d’attente pour s’inscrire) https://blog.google/technology/ai/musiclm-google-ai-test-kitchen/
Project Gameface : utilisation des expressions du visage pour commander une souris et un ordinateur, pour les personnes qui ont perdu leur mobilité https://blog.google/technology/ai/google-project-gameface/
VisualBlocks : pour expérimenter dans une interface drag’n drop avec le développement de modèles pour Tensorflow lite et js https://visualblocks.withgoogle.com/
MakerStudio : pour les bidouilleurs et développeurs https://makersuite.google.com/
https://developers.googleblog.com/2023/05/palm-api-and-makersuite-moving-into-public-preview.html

Search Labs

Article : https://blog.google/products/search/generative-ai-search/

Expérimentations pour rajouter l’IA générative dans Google Search
Faire des recherches avec des requêtes avec des phrases plus complexes, en intégrant des réponses comme Bard, avec des liens, des suggestions d’autres recherches associées
Mais aussi proposer des publicités mieux ciblées
On peut s’inscrire à Search Labs pour tester cette nouvelle expérience, mais au début juste en anglais et juste pour les US
Des intégrations avec Google Shopping pour proposer et filtrer des produits qui correspondent à la requête
Recherche à l’aide d’image, avec Google Lens : 12 milliards de recherches visuelles par mois

Palm et Bard

Annonce du modèle LLM Palm 2 utilisé dans Bard et dans Google Cloud https://blog.google/technology/ai/google-palm-2-ai-large-language-model/
PaLM 2 est en cours d’intégration dans 25 produits de Google
Supportera 100 langues différentes (pour l’instant seulement l’anglais, japonais et coréen), avec déjà les 40 langues les plus parlées d’ici à la fin de l’année
Maintenant disponible dans 180 pays… sauf l’Europe !!!
Capacité de raisonnement accrue
Peut coder dans une vingtaine de langages de programmation différents dont Groovy
Différentes tailles de modèles : Gecko, Otter, Bison et Unicorn, mais le nombre de paramètres n’est pas communiquée, comme pour GPT-4 d’OpenAI
Utilisable pour des requêtes et pour du chat
Des modèles dérivées fine-tunés Med-PaLM 2 sur du savoir médical, sur l’analyse visuelle des radios et Sec-PaLM, entrainé sur des cas d’utilisation sur le thème de la cybersécurité, pour aider à déceler des scripts malicieux, des vecteurs d’attaque
Sundar Pichai a aussi annoncé que Google travaillait déjà sur la prochaine évolution de ses LLM avec un modèle appelé Gemini. Peu de détails à part qu’il sera multimodal (en particulier recherche combinée image et texte par ex.)
Partenariat et intégration d’Adobe Firefly dans Bard pour générer des images https://blog.adobe.com/en/publish/2023/05/10/adobe-firefly-adobe-express-google-bard

Duet AI pour Google Workspace

Article : https://workspace.google.com/blog/product-announcements/duet-ai

Dans Gmails et Docs, propose d’aider à la rédaction de vos emails et documents
- une extension de “smart compose” qui va permettre de générer des emails entiers, d’améliorer le style, de corriger la grammaire, éviter les répétitions de texte
Dans Docs, des nouveaux “smart chips” pour rajouter des variables, des templates
Dans Slides, rajouter des images générées par IA
Des prompts dans Sheets pour générer un draft de table
Dans Google Meet, possibilité de créer une image de fond customisée avec Generative AI
Ces améliorations font parties de Workspace Labs auquel on peut s’inscrire dans la liste d’attente https://workspace.google.com/labs-sign-up/

Google Cloud

Intégration de Generative AI partout https://cloud.google.com/blog/products/ai-machine-learning/google-cloud-launches-new-ai-models-opens-generative-ai-studio

Nouvelles VM A3 avec les GPUs H100 de Nvidia, idéal pour l’entrainement de modèles de machine learning, avec 26 exaFlops de performance https://cloud.google.com/blog/products/compute/introducing-a3-supercomputers-with-nvidia-h100-gpus
Trois nouveaux modèles LLM dans Vertex AI : Imagen (private preview) pour générer des images, Codey pour la génération de code, et Chirp pour la génération de la parole supportant 100 langues différentes avec 2 milliards de paramètres vocaux
Model Garden : avec les modèles de machine learning y compris externes et open sources
Ajout des embeddings pour le texte et l’image
RLHF, Reinforcement Learning from Human Feedback bientôt intégrer pour étendre Vertex AI tuning et prompt design avec une boucle de feedback humaine
Generative AI Studio pour tester ses prompts zero-shot, one-shot, multi-shots
Duet AI pour Google Cloud https://cloud.google.com/blog/products/application-modernization/introducing-duet-ai-for-google-cloud
Assistance de code dans VSCode et bientôt les IDEs JetBrains grâce au plugin Cloud Code, et dans Cloud Workstations.
Intégration dans les IDEs d’un chat pour comme un compagnon pour discuter d’architecture, trouver les commandes à lancer pour son projet
Le modèle de code de Codey fonctionne sur une vingtaine de languages de programmation, mais un modèle fine-tuné a été entrainé sur toute la doc de Google Cloud, donc pourra aider en particulier sur l’utilisation des APIs de Google Cloud, ou l’utilisation de la ligne de commande gcloud
Duet AI est aussi dans App Sheet, la plateforme low/no-code, et permettra de chatter avec un chatbot pour générer une application App Sheet
Quoi de neuf dans Firebase https://firebase.blog/posts/2023/05/whats-new-at-google-io

Web

Article : https://developers.googleblog.com/2023/05/io23-developer-keynote-recap.html

Flutter 3 et Dart 3.10 https://io.google/2023/program/7a253260-3941-470b-8a4d-4253af000119/
WebAssembly
https://io.google/2023/program/1d176349-7cf8-4b51-b816-a90fc9d7d479/
WebGPU
https://io.google/2023/program/0da196f5-5169-43ff-91db-8762e2c424a2/
Baseline
https://io.google/2023/program/528a223c-a3d6-46c5-84e4-88af2cf62670/
https://web.dev/baseline/

Nous contacter

Pour réagir à cet épisode, venez discuter sur le groupe Google https://groups.google.com/group/lescastcodeurs

Contactez-nous via twitter https://twitter.com/lescastcodeurs
Faire un crowdcast ou une crowdquestion
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Tous les épisodes et toutes les infos sur https://lescastcodeurs.com/