{"id":9584,"date":"2022-09-30T09:11:40","date_gmt":"2022-09-30T07:11:40","guid":{"rendered":"https:\/\/www.lenseup.com\/?p=9584"},"modified":"2022-11-15T06:57:23","modified_gmt":"2022-11-15T05:57:23","slug":"openai-lance-ai-transcription-traduction-open-source","status":"publish","type":"post","link":"https:\/\/www.lenseup.com\/fr\/openai-lance-ai-transcription-traduction-open-source\/","title":{"rendered":"OpenAI lance l&rsquo;IA de transcription et de traduction \u00a0\u00bb Whisper \u00a0\u00bb en open source"},"content":{"rendered":"<p><strong>OpenAI a pr\u00e9sent\u00e9 un nouveau syst\u00e8me de<a href=\"https:\/\/www.lenseup.com\/fr\/solutions-audio\/transcription-audio-francais-et-langues-etrangeres\/\"> reconnaissance automatique de la parole (ASR)<\/a> appel\u00e9 Whisper sous la forme d&rsquo;un kit logiciel open-source sur GitHub.<\/strong> L&rsquo;IA de Whisper peut transcrire des conversations en plusieurs langues et les traduire en anglais, et les \u00e9quipes de GPT-3 affirment que l&rsquo;entra\u00eenement de Whisper permet de mieux distinguer les voix dans des environnements bruyants et de comprendre les accents lourds et le langage technique.<\/p>\n<p>La reconnaissance automatique de la parole, souvent appel\u00e9e ASR, transforme le langage parl\u00e9 en texte. Il s&rsquo;agit d&rsquo;un logiciel de conversion de la parole en texte qui convertit automatiquement votre voix en langage \u00e9crit.<\/p>\n<p>Cette technologie a de nombreuses applications, notamment les logiciels de dict\u00e9e et de messagerie vocale visuelle.<!--more--><\/p>\n<h2>Speech to text: d\u00e9couvrons Whisper, outil d&rsquo; ASR (<b>Automatic speech recognition)<\/b><\/h2>\n<p>OpenAI a entra\u00een\u00e9 Whisper \u00e0 partir de 680 000 heures de donn\u00e9es audio et de transcriptions correspondantes en 98 langues collect\u00e9es sur le web. Selon OpenAI, cette approche de collecte ouverte a conduit \u00e0 \u00ab\u00a0une meilleure robustesse aux accents, au bruit de fond et au langage technique.\u00a0\u00bb Il peut \u00e9galement d\u00e9tecter la langue parl\u00e9e et la traduire en anglais.<\/p>\n<p><strong>OpenAI d\u00e9crit Whisper comme un transformateur encodeur-d\u00e9codeur,<\/strong> un type de r\u00e9seau neuronal qui peut utiliser le contexte glan\u00e9 dans les donn\u00e9es d&rsquo;entr\u00e9e pour apprendre des associations qui peuvent ensuite \u00eatre traduites dans la sortie du mod\u00e8le. OpenAI pr\u00e9sente cet aper\u00e7u du fonctionnement de Whisper :<\/p>\n<p>L&rsquo;audio d&rsquo;entr\u00e9e est divis\u00e9 en morceaux de 30 secondes, converti en un spectrogramme log-Mel, puis transmis \u00e0 un encodeur. Un d\u00e9codeur est entra\u00een\u00e9 \u00e0 pr\u00e9dire la l\u00e9gende du texte correspondant, m\u00e9lang\u00e9 \u00e0 des jetons sp\u00e9ciaux qui dirigent le mod\u00e8le unique vers des t\u00e2ches telles que l&rsquo;identification de la langue, l&rsquo;horodatage au niveau de la phrase, la transcription multilingue de la parole et la traduction de la parole en anglais.<\/p>\n<p><strong>Bien qu&rsquo;impressionnant, le document de recherche d&rsquo;OpenAI sugg\u00e8re que l&rsquo;ASR n&rsquo;est vraiment performant que dans une dizaine de langues,<\/strong> une limitation qui d\u00e9coule probablement du fait que les deux tiers des donn\u00e9es d&rsquo;entra\u00eenement sont en anglais. Et bien qu&rsquo;OpenAI admette que la pr\u00e9cision de Whisper n&rsquo;est pas toujours \u00e0 la hauteur des autres mod\u00e8les, la nature \u00ab\u00a0flexible\u00a0\u00bb de son entrainement lui donne une longueur d&rsquo;avance sur les autres mod\u00e8les. Et bien que l&rsquo;entrainement\u00a0 \u00ab\u00a0flexible\u00a0\u00bb permette \u00e0 Whisper de discerner et de transcrire la parole \u00e0 travers le bruit de fond et les variations d&rsquo;accent, elle cr\u00e9e \u00e9galement de nouveaux probl\u00e8mes.<\/p>\n<h2>Un logiciel de reconnaissance vocale open source<\/h2>\n<p>Selon Openai, \u00ab\u00a0Nos \u00e9tudes montrent que, par rapport \u00e0 de nombreux syst\u00e8mes ASR existants, les mod\u00e8les pr\u00e9sentent une meilleure robustesse aux accents, au bruit de fond, au langage technique, ainsi qu&rsquo;\u00e0 la traduction de plusieurs langues vers l&rsquo;anglais ; et que la pr\u00e9cision de la reconnaissance vocale et de la traduction est proche de ce qui se fait de mieux\u00a0\u00bb, expliquent les chercheurs d&rsquo;OpenAI sur GitHub. \u00ab\u00a0Cependant, comme les mod\u00e8les sont form\u00e9s de mani\u00e8re faiblement supervis\u00e9e en utilisant des donn\u00e9es parasit\u00e9es par du bruit de fond \u00e0 grande \u00e9chelle, les pr\u00e9dictions peuvent inclure des textes qui ne sont pas r\u00e9ellement prononc\u00e9s dans l&rsquo;audio (c&rsquo;est-\u00e0-dire ce qu&rsquo;on appelle le ph\u00e9nom\u00e8ne d&rsquo;hallucination). Nous supposons que cela se produit parce que, \u00e9tant donn\u00e9 leur connaissance g\u00e9n\u00e9rale du langage, les mod\u00e8les combinent l&rsquo;essai de pr\u00e9dire le prochain mot dans l&rsquo;audio avec l&rsquo;essai de transcrire l&rsquo;audio lui-m\u00eame.\u00a0\u00bb<\/p>\n<p>OpenAI fait beaucoup parler d&rsquo;elle pour GPT-3 et d&rsquo;autres produits comme le g\u00e9n\u00e9rateur de texte-image DALL-E. Whisper donne un aper\u00e7u de la mani\u00e8re dont la recherche en IA de la soci\u00e9t\u00e9 s&rsquo;\u00e9tend \u00e0 d&rsquo;autres domaines. Whisper est un logiciel libre, mais la valeur de la reconnaissance vocale par l&rsquo;IA \u00e0 base de r\u00e9seaux neuronaux pour les particuliers et les entreprises a \u00e9t\u00e9 prouv\u00e9e de mani\u00e8re concluante \u00e0 ce stade. Whisper pourrait \u00eatre un point de d\u00e9part pour l&rsquo;adh\u00e9sion d&rsquo;OpenAI, comme l&rsquo;ont d\u00e9j\u00e0 sp\u00e9cul\u00e9 les chercheurs.<\/p>\n<p><strong>Openai pr\u00e9voit que les capacit\u00e9s de transcription des mod\u00e8les Whisper pourront \u00eatre utilis\u00e9es pour am\u00e9liorer l&rsquo;accessibilit\u00e9 de certains outils.<\/strong> Bien que les mod\u00e8les Whisper ne puissent pas \u00eatre utilis\u00e9s d&#8217;embl\u00e9e pour la transcription en temps r\u00e9el, leur vitesse et leur taille sugg\u00e8rent que d&rsquo;autres entit\u00e9s pourraient \u00eatre en mesure de cr\u00e9er des applications permettant la reconnaissance et la traduction de la parole en temps quasi r\u00e9el.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>OpenAI a pr\u00e9sent\u00e9 un nouveau syst\u00e8me de reconnaissance automatique de la parole (ASR) appel\u00e9 Whisper sous la forme d&rsquo;un kit logiciel open-source sur GitHub. L&rsquo;IA de Whisper peut transcrire des conversations en plusieurs langues et les traduire en anglais, et les \u00e9quipes de GPT-3 affirment que l&rsquo;entra\u00eenement de Whisper permet de mieux distinguer les voix [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":9587,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[71,77,69,1],"tags":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v23.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>OpenAI lance l&#039;IA de transcription et de traduction &quot; Whisper &quot; en open source<\/title>\n<meta name=\"description\" content=\"OpenAI a pr\u00e9sent\u00e9 un nouveau syst\u00e8me de reconnaissance automatique de la parole (ASR) appel\u00e9 Whisper sous la forme d&#039;un kit logiciel open-source sur GitHub.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.lenseup.com\/fr\/openai-lance-ai-transcription-traduction-open-source\/\" \/>\n<meta property=\"og:locale\" content=\"fr_FR\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"OpenAI lance l&#039;IA de transcription et de traduction &quot; Whisper &quot; en open source\" \/>\n<meta property=\"og:description\" content=\"OpenAI a pr\u00e9sent\u00e9 un nouveau syst\u00e8me de reconnaissance automatique de la parole (ASR) appel\u00e9 Whisper sous la forme d&#039;un kit logiciel open-source sur GitHub.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.lenseup.com\/fr\/openai-lance-ai-transcription-traduction-open-source\/\" \/>\n<meta property=\"og:site_name\" content=\"LenseUp, solutions vid\u00e9o et audio multilingues. Audioguides, audiobooks, traductions audio et video\" \/>\n<meta property=\"article:published_time\" content=\"2022-09-30T07:11:40+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2022-11-15T05:57:23+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/www.lenseup.com\/wp-content\/uploads\/2022\/09\/open-ai-whisper.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1640\" \/>\n\t<meta property=\"og:image:height\" content=\"924\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"LenseUp\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"\u00c9crit par\" \/>\n\t<meta name=\"twitter:data1\" content=\"LenseUp\" \/>\n\t<meta name=\"twitter:label2\" content=\"Dur\u00e9e de lecture estim\u00e9e\" \/>\n\t<meta name=\"twitter:data2\" content=\"4 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/www.lenseup.com\/fr\/openai-lance-ai-transcription-traduction-open-source\/\",\"url\":\"https:\/\/www.lenseup.com\/fr\/openai-lance-ai-transcription-traduction-open-source\/\",\"name\":\"OpenAI lance l'IA de transcription et de traduction \\\" Whisper \\\" en open source\",\"isPartOf\":{\"@id\":\"https:\/\/www.lenseup.com\/fr\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/www.lenseup.com\/fr\/openai-lance-ai-transcription-traduction-open-source\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/www.lenseup.com\/fr\/openai-lance-ai-transcription-traduction-open-source\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/www.lenseup.com\/wp-content\/uploads\/2022\/09\/open-ai-whisper.jpg\",\"datePublished\":\"2022-09-30T07:11:40+00:00\",\"dateModified\":\"2022-11-15T05:57:23+00:00\",\"author\":{\"@id\":\"https:\/\/www.lenseup.com\/fr\/#\/schema\/person\/dadfed1f52570f3378a4679e8e398337\"},\"description\":\"OpenAI a pr\u00e9sent\u00e9 un nouveau syst\u00e8me de reconnaissance automatique de la parole (ASR) appel\u00e9 Whisper sous la forme d'un kit logiciel open-source sur GitHub.\",\"breadcrumb\":{\"@id\":\"https:\/\/www.lenseup.com\/fr\/openai-lance-ai-transcription-traduction-open-source\/#breadcrumb\"},\"inLanguage\":\"fr-FR\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/www.lenseup.com\/fr\/openai-lance-ai-transcription-traduction-open-source\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\/\/www.lenseup.com\/fr\/openai-lance-ai-transcription-traduction-open-source\/#primaryimage\",\"url\":\"https:\/\/www.lenseup.com\/wp-content\/uploads\/2022\/09\/open-ai-whisper.jpg\",\"contentUrl\":\"https:\/\/www.lenseup.com\/wp-content\/uploads\/2022\/09\/open-ai-whisper.jpg\",\"width\":1640,\"height\":924},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/www.lenseup.com\/fr\/openai-lance-ai-transcription-traduction-open-source\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Accueil\",\"item\":\"https:\/\/www.lenseup.com\/fr\/7440-2\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"OpenAI lance l&#8217;IA de transcription et de traduction &#8221; Whisper &#8221; en open source\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/www.lenseup.com\/fr\/#website\",\"url\":\"https:\/\/www.lenseup.com\/fr\/\",\"name\":\"LenseUp, multilingual audio and video solutions\",\"description\":\"Traductions et contenus audio \/ video dans 30 langues.\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/www.lenseup.com\/fr\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"fr-FR\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/www.lenseup.com\/fr\/#\/schema\/person\/dadfed1f52570f3378a4679e8e398337\",\"name\":\"LenseUp\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\/\/www.lenseup.com\/fr\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/630b0f43e55077cd2abe39e3e9e2a52c?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/630b0f43e55077cd2abe39e3e9e2a52c?s=96&d=mm&r=g\",\"caption\":\"LenseUp\"}}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"OpenAI lance l'IA de transcription et de traduction \" Whisper \" en open source","description":"OpenAI a pr\u00e9sent\u00e9 un nouveau syst\u00e8me de reconnaissance automatique de la parole (ASR) appel\u00e9 Whisper sous la forme d'un kit logiciel open-source sur GitHub.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.lenseup.com\/fr\/openai-lance-ai-transcription-traduction-open-source\/","og_locale":"fr_FR","og_type":"article","og_title":"OpenAI lance l'IA de transcription et de traduction \" Whisper \" en open source","og_description":"OpenAI a pr\u00e9sent\u00e9 un nouveau syst\u00e8me de reconnaissance automatique de la parole (ASR) appel\u00e9 Whisper sous la forme d'un kit logiciel open-source sur GitHub.","og_url":"https:\/\/www.lenseup.com\/fr\/openai-lance-ai-transcription-traduction-open-source\/","og_site_name":"LenseUp, solutions vid\u00e9o et audio multilingues. Audioguides, audiobooks, traductions audio et video","article_published_time":"2022-09-30T07:11:40+00:00","article_modified_time":"2022-11-15T05:57:23+00:00","og_image":[{"width":1640,"height":924,"url":"https:\/\/www.lenseup.com\/wp-content\/uploads\/2022\/09\/open-ai-whisper.jpg","type":"image\/jpeg"}],"author":"LenseUp","twitter_card":"summary_large_image","twitter_misc":{"\u00c9crit par":"LenseUp","Dur\u00e9e de lecture estim\u00e9e":"4 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/www.lenseup.com\/fr\/openai-lance-ai-transcription-traduction-open-source\/","url":"https:\/\/www.lenseup.com\/fr\/openai-lance-ai-transcription-traduction-open-source\/","name":"OpenAI lance l'IA de transcription et de traduction \" Whisper \" en open source","isPartOf":{"@id":"https:\/\/www.lenseup.com\/fr\/#website"},"primaryImageOfPage":{"@id":"https:\/\/www.lenseup.com\/fr\/openai-lance-ai-transcription-traduction-open-source\/#primaryimage"},"image":{"@id":"https:\/\/www.lenseup.com\/fr\/openai-lance-ai-transcription-traduction-open-source\/#primaryimage"},"thumbnailUrl":"https:\/\/www.lenseup.com\/wp-content\/uploads\/2022\/09\/open-ai-whisper.jpg","datePublished":"2022-09-30T07:11:40+00:00","dateModified":"2022-11-15T05:57:23+00:00","author":{"@id":"https:\/\/www.lenseup.com\/fr\/#\/schema\/person\/dadfed1f52570f3378a4679e8e398337"},"description":"OpenAI a pr\u00e9sent\u00e9 un nouveau syst\u00e8me de reconnaissance automatique de la parole (ASR) appel\u00e9 Whisper sous la forme d'un kit logiciel open-source sur GitHub.","breadcrumb":{"@id":"https:\/\/www.lenseup.com\/fr\/openai-lance-ai-transcription-traduction-open-source\/#breadcrumb"},"inLanguage":"fr-FR","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.lenseup.com\/fr\/openai-lance-ai-transcription-traduction-open-source\/"]}]},{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/www.lenseup.com\/fr\/openai-lance-ai-transcription-traduction-open-source\/#primaryimage","url":"https:\/\/www.lenseup.com\/wp-content\/uploads\/2022\/09\/open-ai-whisper.jpg","contentUrl":"https:\/\/www.lenseup.com\/wp-content\/uploads\/2022\/09\/open-ai-whisper.jpg","width":1640,"height":924},{"@type":"BreadcrumbList","@id":"https:\/\/www.lenseup.com\/fr\/openai-lance-ai-transcription-traduction-open-source\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Accueil","item":"https:\/\/www.lenseup.com\/fr\/7440-2\/"},{"@type":"ListItem","position":2,"name":"OpenAI lance l&#8217;IA de transcription et de traduction &#8221; Whisper &#8221; en open source"}]},{"@type":"WebSite","@id":"https:\/\/www.lenseup.com\/fr\/#website","url":"https:\/\/www.lenseup.com\/fr\/","name":"LenseUp, multilingual audio and video solutions","description":"Traductions et contenus audio \/ video dans 30 langues.","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.lenseup.com\/fr\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"fr-FR"},{"@type":"Person","@id":"https:\/\/www.lenseup.com\/fr\/#\/schema\/person\/dadfed1f52570f3378a4679e8e398337","name":"LenseUp","image":{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/www.lenseup.com\/fr\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/630b0f43e55077cd2abe39e3e9e2a52c?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/630b0f43e55077cd2abe39e3e9e2a52c?s=96&d=mm&r=g","caption":"LenseUp"}}]}},"_links":{"self":[{"href":"https:\/\/www.lenseup.com\/fr\/wp-json\/wp\/v2\/posts\/9584"}],"collection":[{"href":"https:\/\/www.lenseup.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.lenseup.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.lenseup.com\/fr\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.lenseup.com\/fr\/wp-json\/wp\/v2\/comments?post=9584"}],"version-history":[{"count":5,"href":"https:\/\/www.lenseup.com\/fr\/wp-json\/wp\/v2\/posts\/9584\/revisions"}],"predecessor-version":[{"id":9586,"href":"https:\/\/www.lenseup.com\/fr\/wp-json\/wp\/v2\/posts\/9584\/revisions\/9586"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.lenseup.com\/fr\/wp-json\/wp\/v2\/media\/9587"}],"wp:attachment":[{"href":"https:\/\/www.lenseup.com\/fr\/wp-json\/wp\/v2\/media?parent=9584"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.lenseup.com\/fr\/wp-json\/wp\/v2\/categories?post=9584"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.lenseup.com\/fr\/wp-json\/wp\/v2\/tags?post=9584"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}