{"id":9684,"date":"2022-10-07T19:32:54","date_gmt":"2022-10-07T17:32:54","guid":{"rendered":"https:\/\/www.lenseup.com\/google-audio-lm-is-already-capable-of-making-speeches-with-your-voice\/"},"modified":"2023-12-27T17:52:53","modified_gmt":"2023-12-27T16:52:53","slug":"google-audio-lm-une-ia-capable-de-generer-des-conversations-avec-votre-voix","status":"publish","type":"post","link":"https:\/\/www.lenseup.com\/fr\/google-audio-lm-une-ia-capable-de-generer-des-conversations-avec-votre-voix\/","title":{"rendered":"Google Audio LM:  une IA capable de g\u00e9n\u00e9rer des conversations \u00e0 partir de votre voix"},"content":{"rendered":"<p>Les ordinateurs peuvent d\u00e9j\u00e0 nous battre aux \u00e9checs, ils lisent nos textes et ont commenc\u00e9 \u00e0 \u00e9crire pour nous. Nous pouvions nous douter que l&rsquo;intelligence artificielle serait capable de faire de m\u00eame avec les conversations et la musique!<\/p>\n<p>La division de R&amp;D de Google vient de pr\u00e9senter <a href=\"https:\/\/arxiv.org\/abs\/2209.03143\">AudioLM<\/a>, un outil permettant de g\u00e9n\u00e9rer du son de haute qualit\u00e9 qui demeure coh\u00e9rent sur la longueur Pour ce faire, il part d&rsquo;un enregistrement de quelques secondes seulement, et est capable de le prolonger de mani\u00e8re naturelle et coh\u00e9rente. Ce qui est remarquable, c&rsquo;est qu&rsquo;il y parvient sans avoir \u00e9t\u00e9 entra\u00een\u00e9 avec des transcriptions ou des annotations ant\u00e9rieures, m\u00eame si le discours g\u00e9n\u00e9r\u00e9 est syntaxiquement et s\u00e9mantiquement plausible. De plus, Audio LM maintient l&rsquo;identit\u00e9 et la prosodie du locuteur (la musique du langage, sa structure temporelle, rythmique et m\u00e9lodique) \u00e0 tel point que l&rsquo;auditeur est incapable de discerner quelle partie de l&rsquo;audio est originale et quelle partie a \u00e9t\u00e9 g\u00e9n\u00e9r\u00e9e par une intelligence artificielle.<\/p>\n<p>Les exemples de cette intelligence artificielle sont frappants. Non seulement Audio LM est capable de reproduire l&rsquo;articulation, lle timbre et l&rsquo;intensit\u00e9, mais ce mod\u00e8le de langage est \u00e9galement capable de saisir le son de la respiration de l&rsquo;orateur et de former des phrases qui ont su sens. S&rsquo;il ne part pas d&rsquo;un son de studio, mais d&rsquo;un son avec un bruit de fond, AudioLM le reproduit pour lui donner une continuit\u00e9.<!--more--><\/p>\n<h2>Une intelligence artificielle form\u00e9e \u00e0 la s\u00e9mantique et \u00e0 l&rsquo;acoustique<\/h2>\n<p>Comment cela fonctionne t-il ? La g\u00e9n\u00e9ration d&rsquo;audio ou de musique n&rsquo;est pas nouvelle. Mais la m\u00e9thode imagin\u00e9e par les chercheurs de Google pour r\u00e9soudre le probl\u00e8me est la suivante. De chaque audio, des marqueurs s\u00e9mantiques sont extraits pour encoder une structure de haut niveau (phon\u00e8mes, lexique, s\u00e9mantique&#8230;), et des marqueurs acoustiques (identit\u00e9 du locuteur, qualit\u00e9 de l&rsquo;enregistrement, bruit de fond&#8230;). Avec ces donn\u00e9es d\u00e9j\u00e0 trait\u00e9es et compr\u00e9hensibles par l&rsquo;intelligence artificielle, AudioLM commence son travail en \u00e9tablissant une hi\u00e9rarchie dans laquelle il pr\u00e9dit d&rsquo;abord les marqueurs s\u00e9mantiques, qui sont ensuite utilis\u00e9s comme conditions pour pr\u00e9dire les marqueurs acoustiques. Ces derniers sont ensuite r\u00e9utilis\u00e9s \u00e0 la fin pour convertir les bits en quelque chose que les humains peuvent entendre.<\/p>\n<p>Cette s\u00e9paration s\u00e9mantique de l&rsquo;acoustique, et de sa hi\u00e9rarchie, n&rsquo;est pas seulement une pratique b\u00e9n\u00e9fique pour l&rsquo;entra\u00eenement des mod\u00e8les de langage pour g\u00e9n\u00e9rer la parole. Selon les chercheurs, elle est \u00e9galement plus efficace pour poursuivre les compositions pour piano, comme ils le montrent sur leur site web. Ce mod\u00e8le est bien meilleur que les mod\u00e8les qui ne sont entra\u00een\u00e9s qu&rsquo;\u00e0 l&rsquo;aide de marqueurs acoustiques.<\/p>\n<p>Le plus important dans l&rsquo;intelligence artificielle d&rsquo;AudioLM n&rsquo;est pas qu&rsquo;elle soit capable de poursuivre des discours et des m\u00e9lodies, mais qu&rsquo;elle puisse tout faire en m\u00eame temps. Il s&rsquo;agit donc d&rsquo;un mod\u00e8le de langage unique qui peut \u00eatre utilis\u00e9 pour convertir du texte en parole &#8211; un robot pourrait lire des livres entiers &#8211; ou pour rendre n&rsquo;importe quel appareil capable de communiquer avec des personnes en utilisant une voix famili\u00e8re. Cette id\u00e9e a d\u00e9j\u00e0 \u00e9t\u00e9 explor\u00e9e par Amazon, qui a envisag\u00e9 d&rsquo;utiliser la voix de proches dans ses enceintes Alexa.<\/p>\n<h2>Des dangers potentiels?<\/h2>\n<p>Des logiciels comme Dalle-2 et Stable Diffusion existent d\u00e9j\u00e0: ce sont des outils exceptionnels qui permettent d&rsquo;esquisser des id\u00e9es ou de g\u00e9n\u00e9rer des ressources cr\u00e9atives en quelques secondes. L&rsquo;audio synth\u00e9tique peut avoir beaucoup d&rsquo;impact,\u00a0 et on peut imaginer que la voix d&rsquo;un annonceur soit utilis\u00e9e \u00e0 la demande par diverses entreprises. Des films pourraient \u00eatre doubl\u00e9s avec les voix d&rsquo;acteurs disparus. Le lecteur se demande peut-\u00eatre si cette possibilit\u00e9, bien que passionnante, n&rsquo;est pas dangereuse. Tout enregistrement audio pourrait \u00eatre manipul\u00e9 \u00e0 des fins politiques, juridiques ou judiciaires. Mais selon Google, si les humains peuvent avoir du mal \u00e0 d\u00e9tecter ce qui provient d&rsquo;une intelligence artificielle, un ordinateur peut d\u00e9tecter si l&rsquo;audio est organique ou non. En d&rsquo;autres termes, non seulement la machine peut nous remplacer, mais une autre machine sera indispensable pour \u00e9valuer son travail.<\/p>\n<p>Pour le moment, AudioLM n&rsquo;est pas ouvert au public, il s&rsquo;agit uniquement d&rsquo;un mod\u00e8le de langage qui peut \u00eatre int\u00e9gr\u00e9 dans diff\u00e9rents projets. Mais cette d\u00e9monstration, ainsi que le programme musical Jukebox d&rsquo;OpenAI, montre \u00e0 quel point nous entrons rapidement dans un nouveau monde o\u00f9 personne ne saura, ou ne se souciera, de savoir si cette photo a \u00e9t\u00e9 prise par une personne ou s&rsquo;il y a une personne ou une voix off g\u00e9n\u00e9r\u00e9e artificiellement \u00e0 l&rsquo;autre bout du fil en temps r\u00e9el.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Les ordinateurs peuvent d\u00e9j\u00e0 nous battre aux \u00e9checs, ils lisent nos textes et ont commenc\u00e9 \u00e0 \u00e9crire pour nous. Nous pouvions nous douter que l&rsquo;intelligence artificielle serait capable de faire de m\u00eame avec les conversations et la musique! La division de R&amp;D de Google vient de pr\u00e9senter AudioLM, un outil permettant de g\u00e9n\u00e9rer du son [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":9689,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[69],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v23.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Google Audio LM: une IA capable de g\u00e9n\u00e9rer des conversations \u00e0 partir de votre voix<\/title>\n<meta name=\"description\" content=\"D\u00e9couvrez une intelligence artificielle qui est capable de g\u00e9n\u00e9rer des conversations et de la musique!\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.lenseup.com\/fr\/google-audio-lm-une-ia-capable-de-generer-des-conversations-avec-votre-voix\/\" \/>\n<meta property=\"og:locale\" content=\"fr_FR\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Google Audio LM: une IA capable de g\u00e9n\u00e9rer des conversations \u00e0 partir de votre voix\" \/>\n<meta property=\"og:description\" content=\"D\u00e9couvrez une intelligence artificielle qui est capable de g\u00e9n\u00e9rer des conversations et de la musique!\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.lenseup.com\/fr\/google-audio-lm-une-ia-capable-de-generer-des-conversations-avec-votre-voix\/\" \/>\n<meta property=\"og:site_name\" content=\"LenseUp, solutions vid\u00e9o et audio multilingues. Audioguides, audiobooks, traductions audio et video\" \/>\n<meta property=\"article:published_time\" content=\"2022-10-07T17:32:54+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2023-12-27T16:52:53+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/www.lenseup.com\/wp-content\/uploads\/2022\/10\/google-audio-lm-1.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1640\" \/>\n\t<meta property=\"og:image:height\" content=\"924\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"LenseUp\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"\u00c9crit par\" \/>\n\t<meta name=\"twitter:data1\" content=\"LenseUp\" \/>\n\t<meta name=\"twitter:label2\" content=\"Dur\u00e9e de lecture estim\u00e9e\" \/>\n\t<meta name=\"twitter:data2\" content=\"4 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/www.lenseup.com\/fr\/google-audio-lm-une-ia-capable-de-generer-des-conversations-avec-votre-voix\/\",\"url\":\"https:\/\/www.lenseup.com\/fr\/google-audio-lm-une-ia-capable-de-generer-des-conversations-avec-votre-voix\/\",\"name\":\"Google Audio LM: une IA capable de g\u00e9n\u00e9rer des conversations \u00e0 partir de votre voix\",\"isPartOf\":{\"@id\":\"https:\/\/www.lenseup.com\/fr\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/www.lenseup.com\/fr\/google-audio-lm-une-ia-capable-de-generer-des-conversations-avec-votre-voix\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/www.lenseup.com\/fr\/google-audio-lm-une-ia-capable-de-generer-des-conversations-avec-votre-voix\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/www.lenseup.com\/wp-content\/uploads\/2022\/10\/google-audio-lm-1.jpg\",\"datePublished\":\"2022-10-07T17:32:54+00:00\",\"dateModified\":\"2023-12-27T16:52:53+00:00\",\"author\":{\"@id\":\"https:\/\/www.lenseup.com\/fr\/#\/schema\/person\/dadfed1f52570f3378a4679e8e398337\"},\"description\":\"D\u00e9couvrez une intelligence artificielle qui est capable de g\u00e9n\u00e9rer des conversations et de la musique!\",\"breadcrumb\":{\"@id\":\"https:\/\/www.lenseup.com\/fr\/google-audio-lm-une-ia-capable-de-generer-des-conversations-avec-votre-voix\/#breadcrumb\"},\"inLanguage\":\"fr-FR\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/www.lenseup.com\/fr\/google-audio-lm-une-ia-capable-de-generer-des-conversations-avec-votre-voix\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\/\/www.lenseup.com\/fr\/google-audio-lm-une-ia-capable-de-generer-des-conversations-avec-votre-voix\/#primaryimage\",\"url\":\"https:\/\/www.lenseup.com\/wp-content\/uploads\/2022\/10\/google-audio-lm-1.jpg\",\"contentUrl\":\"https:\/\/www.lenseup.com\/wp-content\/uploads\/2022\/10\/google-audio-lm-1.jpg\",\"width\":1640,\"height\":924},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/www.lenseup.com\/fr\/google-audio-lm-une-ia-capable-de-generer-des-conversations-avec-votre-voix\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Accueil\",\"item\":\"https:\/\/www.lenseup.com\/fr\/7440-2\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Google Audio LM: une IA capable de g\u00e9n\u00e9rer des conversations \u00e0 partir de votre voix\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/www.lenseup.com\/fr\/#website\",\"url\":\"https:\/\/www.lenseup.com\/fr\/\",\"name\":\"LenseUp, multilingual audio and video solutions\",\"description\":\"Traductions et contenus audio \/ video dans 30 langues.\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/www.lenseup.com\/fr\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"fr-FR\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/www.lenseup.com\/fr\/#\/schema\/person\/dadfed1f52570f3378a4679e8e398337\",\"name\":\"LenseUp\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\/\/www.lenseup.com\/fr\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/630b0f43e55077cd2abe39e3e9e2a52c?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/630b0f43e55077cd2abe39e3e9e2a52c?s=96&d=mm&r=g\",\"caption\":\"LenseUp\"}}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Google Audio LM: une IA capable de g\u00e9n\u00e9rer des conversations \u00e0 partir de votre voix","description":"D\u00e9couvrez une intelligence artificielle qui est capable de g\u00e9n\u00e9rer des conversations et de la musique!","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.lenseup.com\/fr\/google-audio-lm-une-ia-capable-de-generer-des-conversations-avec-votre-voix\/","og_locale":"fr_FR","og_type":"article","og_title":"Google Audio LM: une IA capable de g\u00e9n\u00e9rer des conversations \u00e0 partir de votre voix","og_description":"D\u00e9couvrez une intelligence artificielle qui est capable de g\u00e9n\u00e9rer des conversations et de la musique!","og_url":"https:\/\/www.lenseup.com\/fr\/google-audio-lm-une-ia-capable-de-generer-des-conversations-avec-votre-voix\/","og_site_name":"LenseUp, solutions vid\u00e9o et audio multilingues. Audioguides, audiobooks, traductions audio et video","article_published_time":"2022-10-07T17:32:54+00:00","article_modified_time":"2023-12-27T16:52:53+00:00","og_image":[{"width":1640,"height":924,"url":"https:\/\/www.lenseup.com\/wp-content\/uploads\/2022\/10\/google-audio-lm-1.jpg","type":"image\/jpeg"}],"author":"LenseUp","twitter_card":"summary_large_image","twitter_misc":{"\u00c9crit par":"LenseUp","Dur\u00e9e de lecture estim\u00e9e":"4 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/www.lenseup.com\/fr\/google-audio-lm-une-ia-capable-de-generer-des-conversations-avec-votre-voix\/","url":"https:\/\/www.lenseup.com\/fr\/google-audio-lm-une-ia-capable-de-generer-des-conversations-avec-votre-voix\/","name":"Google Audio LM: une IA capable de g\u00e9n\u00e9rer des conversations \u00e0 partir de votre voix","isPartOf":{"@id":"https:\/\/www.lenseup.com\/fr\/#website"},"primaryImageOfPage":{"@id":"https:\/\/www.lenseup.com\/fr\/google-audio-lm-une-ia-capable-de-generer-des-conversations-avec-votre-voix\/#primaryimage"},"image":{"@id":"https:\/\/www.lenseup.com\/fr\/google-audio-lm-une-ia-capable-de-generer-des-conversations-avec-votre-voix\/#primaryimage"},"thumbnailUrl":"https:\/\/www.lenseup.com\/wp-content\/uploads\/2022\/10\/google-audio-lm-1.jpg","datePublished":"2022-10-07T17:32:54+00:00","dateModified":"2023-12-27T16:52:53+00:00","author":{"@id":"https:\/\/www.lenseup.com\/fr\/#\/schema\/person\/dadfed1f52570f3378a4679e8e398337"},"description":"D\u00e9couvrez une intelligence artificielle qui est capable de g\u00e9n\u00e9rer des conversations et de la musique!","breadcrumb":{"@id":"https:\/\/www.lenseup.com\/fr\/google-audio-lm-une-ia-capable-de-generer-des-conversations-avec-votre-voix\/#breadcrumb"},"inLanguage":"fr-FR","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.lenseup.com\/fr\/google-audio-lm-une-ia-capable-de-generer-des-conversations-avec-votre-voix\/"]}]},{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/www.lenseup.com\/fr\/google-audio-lm-une-ia-capable-de-generer-des-conversations-avec-votre-voix\/#primaryimage","url":"https:\/\/www.lenseup.com\/wp-content\/uploads\/2022\/10\/google-audio-lm-1.jpg","contentUrl":"https:\/\/www.lenseup.com\/wp-content\/uploads\/2022\/10\/google-audio-lm-1.jpg","width":1640,"height":924},{"@type":"BreadcrumbList","@id":"https:\/\/www.lenseup.com\/fr\/google-audio-lm-une-ia-capable-de-generer-des-conversations-avec-votre-voix\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Accueil","item":"https:\/\/www.lenseup.com\/fr\/7440-2\/"},{"@type":"ListItem","position":2,"name":"Google Audio LM: une IA capable de g\u00e9n\u00e9rer des conversations \u00e0 partir de votre voix"}]},{"@type":"WebSite","@id":"https:\/\/www.lenseup.com\/fr\/#website","url":"https:\/\/www.lenseup.com\/fr\/","name":"LenseUp, multilingual audio and video solutions","description":"Traductions et contenus audio \/ video dans 30 langues.","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.lenseup.com\/fr\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"fr-FR"},{"@type":"Person","@id":"https:\/\/www.lenseup.com\/fr\/#\/schema\/person\/dadfed1f52570f3378a4679e8e398337","name":"LenseUp","image":{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/www.lenseup.com\/fr\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/630b0f43e55077cd2abe39e3e9e2a52c?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/630b0f43e55077cd2abe39e3e9e2a52c?s=96&d=mm&r=g","caption":"LenseUp"}}]}},"_links":{"self":[{"href":"https:\/\/www.lenseup.com\/fr\/wp-json\/wp\/v2\/posts\/9684"}],"collection":[{"href":"https:\/\/www.lenseup.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.lenseup.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.lenseup.com\/fr\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.lenseup.com\/fr\/wp-json\/wp\/v2\/comments?post=9684"}],"version-history":[{"count":3,"href":"https:\/\/www.lenseup.com\/fr\/wp-json\/wp\/v2\/posts\/9684\/revisions"}],"predecessor-version":[{"id":9691,"href":"https:\/\/www.lenseup.com\/fr\/wp-json\/wp\/v2\/posts\/9684\/revisions\/9691"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.lenseup.com\/fr\/wp-json\/wp\/v2\/media\/9689"}],"wp:attachment":[{"href":"https:\/\/www.lenseup.com\/fr\/wp-json\/wp\/v2\/media?parent=9684"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.lenseup.com\/fr\/wp-json\/wp\/v2\/categories?post=9684"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.lenseup.com\/fr\/wp-json\/wp\/v2\/tags?post=9684"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}