L’accessibilité des documents est l’une des utilisations les plus courantes de la voix off de la synthèse vocale. Pourquoi ? Parce que les voix TTS sont un outil formidable pour produire de grandes quantités de voix-off en peu de temps. Mais c’est aussi un outil relativement nouveau, qui s’accompagne d’un ensemble unique de défis – en particulier pour les projets de localisation multimédia.

Qu’est-ce que l’accessibilité des documents exactement ?

L’accessibilité numérique consiste à rendre les services en ligne accessibles aux personnes en situation de handicap. Il existe de nombreuses façons de rendre les documents accessibles aux aveugles ou aux malvoyants, y compris les versions en gros caractères, la traduction en braille de catégorie II et, bien sûr, la vocalisation – que ce soit en personne, par téléphone ou par le biais d’enregistrements humains et de synthèse vocale.

Qu’est-ce que la synthèse vocale offre à l’accessibilité ?

Deux choses : sa rapidité et son prix. Réduire les temps d’attente des utilisateurs est crucial pour une véritable accessibilité. Et la synthèse vocale est généralement plus rentable que la voix humaine, notamment pour les projets de traduction interne d’entreprise, d’enseignement et d’apprentissage en ligne. Ces deux facteurs la rendent très attrayante pour les institutions qui sont mandatées pour fournir de l’audio pour leurs textes.

Alors, que devez-vous savoir pour produire une voix-off TTS ?

Comme nous l’avons mentionné précédemment, la TTS présente un ensemble unique de défis – examinons-les.
1. Les documents doivent être reformatés pour la TTS
Contrairement aux voix-off humaines, les voix TTS ont une capacité très limitée à évaluer le contexte. Prévoyez du temps pour un formatage du script audio avant la production. Deuxièmement, essayez d’obtenir des fichiers sources de documents (Word, InDesign, etc.) si possible – cela peut réduire le coût et le délai de formatage du script. Et troisièmement, n’oubliez pas que vous devrez peut-être faire cela pour chaque langue d’un projet de localisation.
2. Traiter les listes
Les listes nécessitent un formatage laborieux pour la sortie TTS. Et bien sûr, de nombreux documents officiels en contiennent. Les bulletins de vote types énumèrent les candidats et les lieux de vote. Les guides des régimes de soins de santé énumèrent généralement tous les médecins ou hôpitaux disponibles pour un patient. Et les annuaires d’entreprise énumèrent tous les employés d’une organisation. Si votre document contient une liste, prévoyez plus de temps pour le formatage du script.
3. Segmentation des fichiers
Si vous travaillez avec un long document, il peut être nécessaire de le diviser en unités audio plus petites. Les fichiers audio plus petits seront plus faciles à utiliser et plus portables, que vous diffusiez l’audio sur Internet ou sur un support dur. Enfin, les fichiers plus petits faciliteront la gestion des langues non latines – par exemple, lors du suivi des prises de voix off en chinois par rapport au script.
4. Phonétique
La TTS a des difficultés particulières avec les acronymes, les séquences de chiffres, les noms et les abréviations. En fonction de la précision requise pour un projet, vous devrez peut-être créer des guides phonétiques. Dans certaines langues, c’est plus facile – par exemple, pour les projets de voix-off en japonais, les termes peuvent être translittérés en katakana. Dans d’autres langues, il peut être nécessaire de développer une clé phonétique avec des orthographes non standard – cela serait fait pour les projets de voix-off TTS en français, par exemple.
5. Toutes les langues n’ont pas le même support TTS
Le support TTS en anglais est excellent. Les moteurs dans cette langue sont même devenus assez bons pour reconnaître le contexte textuel et émotionnel, et il existe de nombreuses voix TTS parmi lesquelles choisir. Mais très peu d’autres langues disposent d’un tel niveau de support – par exemple, il y a beaucoup moins de voix TTS pour les voix off en espagnol d’Amérique latine. Gardez cela à l’esprit, surtout si vous avez un grand nombre de langues.

Les enregistrements TTS ne seront pas « parfaits ».

Il est crucial de s’en souvenir pour les projets TTS. Les polices vocales ont un son étrange et présentent souvent des bruits audibles et gênants, car les syllabes et les phonèmes sont assemblés numériquement. Et ils auront des difficultés particulières avec les termes en langue étrangère (par exemple, des mots anglais dans des scripts de voix-off en portugais brésilien). En plus de cela, chaque langue présente un ensemble particulier de problèmes de prononciation, ce qui signifie que vous ne pouvez pas élaborer de directives phonétiques à l’échelle du projet.
Cela dit, une grande partie de la documentation n’exige pas une prononciation parfaite ou à consonance humaine. Si un juré a besoin d’instructions sur le stationnement, il ne se souciera pas de savoir si le fichier audio a des problèmes numériques, s’il est lu d’une manière monotone ou si la prononciation d’un nom de rue n’est pas parfaite. Ce qui les intéresse, c’est d’obtenir les bonnes informations, au moment où ils en ont besoin, et avec suffisamment de précision pour qu’elles soient utiles. Pour ce type d’application, et pour des raisons de rapidité et de rentabilité, il est difficile de battre la TTS.